其他分享
首页 > 其他分享> > 谈谈我在北理工博士分享会学习到的东西

谈谈我在北理工博士分享会学习到的东西

作者:互联网

上周六的时候,去了北京理工听取了博士生分享会,下面是活动的schedule,文章主要记录一下听会心得!

图片

由于信息量非常巨大,这里我主要挑几个我印象深刻的点和感悟分享一下。其它没有讲到的也是非常好的。

我在实验室是做任务型对话的,对吴金龙博士的分享着重关注,吴博士是爱因互动的CTO,给我们带来了他们公司目前做的一些工作和他对对话系统的一些认识。


1吴金龙博士


1、吴老师的第一个观点就是,工业界中end-to-end的model还只是一个理想的传说。真正将学术界中这种端到端的系统用于线上,那将惨不忍睹!

图片

而我个人做的端到端任务型对话系统比上图的端到端更加的黑盒,这让我比较难受。工业界和学术界还是有不少的差别。

2、吴老师第二个观点,就是在实际工业界中,提高最后交付的产品能力的时候,可以不局限于提高你的model能力,不仅仅是通过复杂的model或者是使命grid search找到最好的参数,我们应该多多考虑model之外的手段,比如说对数据进行改善,对数据进行更好的预处理等等手段,这种非model的改进方法在某些领域上能起到至关重要的效果,这种思想可以用到很多任务上。



2林衍凯博士


第二个我比较喜欢的是林衍凯博士的分享,林衍凯博士是清华孙茂松和刘知远老师团队的优秀博士生,搞nlp的肯定听过清华这个团队。林博士给我们带来的是知识表示,抽取和应用,这里就给出我非常认同的一张ppt

图片

里面有一句话是NLP is still to match text, not tounderstand text!这句话的意思是,目前的nlp技术解决的还只是match文本,谈不上真正的理解文本。


目前来说无论外界宣传的nlp有多么厉害,确实也只是在match text做出了好的工作,那么如何理解文本,他们认为人在理解文本的时候是有背景知识的,向网络中融入知识是理解文本的一种方式,这是他们工作的motivation所在,目前我做的任务型对话也是结合知识库在做,没有知识融入的model仅仅只能过拟合到训练集,仅仅只是模仿!


最后一个给大家带来额外的小惊喜,在听到360总监的分享的时候,他贴出来实习生招聘广告,大家如果有正在找实习的童鞋,不妨了解一下下(绝对不是给360打广告,对实习岗位质量不做任何保证)。如果成功找到了,按道理是要私下请我吃顿饭的,这里饭就算了,点个赞吧!!哈哈。

图片


3自己的看法


最后说几点自己的感觉。

1、北京的机会太特么多了,我以前在哈工大,是比较难听到这种博士分享会的,因为在北京,这种分享的人非常容易聚集起来,能学到的东西和交流的机会很多很多,7.8月份我还会参加其他的讲座。从这而可以看出读书的城市的重要性!


2、可能有同学会问,怎么辨识一个讲座的含金量,如果去听了,又是很水,浪费了几天,划不来,说实话,我也不知道如何保证,我个人的筛选方法是分享的老师有自己熟悉的吗,有靠谱就去,是否是博士生为主的分享,而不是公司为主的分享,大家都知道公司嘛,难免会给自己打打广告,这样容易听不到多少干货,如果是在读博士生,一般会分享自己的前沿工作,还能近距离交流,这是非常好的机会。


总而言之,这次分享会学到的东西不少,真心感谢北京理工大学和各位分享嘉宾的分享!


标签:nlp,文本,博士,北理工,谈谈,博士生,model,分享
来源: https://blog.51cto.com/15127587/2671370