第250章 论文开写

推荐阅读:穿越者大联盟我的神秘赶山异闻犁汉大明与新罗马与无限神机诡秘之主:瑶光刚毅坚卓的他们机战:从高达OO开始求求了,快回家练琴吧斗罗:萧炎穿越成唐三兄弟这无限的世界

    看着两书评论圈里的热闹,以及日涨一千的点击,心情却是不由地好了起来。
    时间还早,习惯夜猫子的他,正是兴奋的时刻呢,不会这么早就去休息的。
    该干些什么呢?当然是开始动工手写人工智能的论文啦!
    其实嘛,英文论文那是现成的,关于负采样训练词向量的,一篇是给出方法,一篇是证明出来,莫浩波需要做的,就是把它们融合起来。
    方法也很简单,就是在前世谷歌论文的基础上,加个证明就好了。
    当然,身为中国人,怎么可能不会写点中文的东西呢?
    现在,重要的问题就是需要做实验,就是训练数据啦。
    那些公开的数据已经从网上下载下来了的,就差工具和应用了。
    13年的这个时候,成熟点的python版本当然是python2.7啦,至于经典的python3.5还没有影子呢。
    不需要使用那些复杂的架构,只需要简单的神经网络就可以实现,使用numpy库就可以了,而这,也恰恰是莫浩波发表这篇paper的原因。
    很快就投入令人向往的自然语言处理(NLP工作),效率是相当快的。
    参数和代码都是现成的,不就是改个文件地址训练么,数据量也不大,也就500M的数据罢了。大的话,他的电脑也跑不起来。
    negtive-sample的cbow大都比cbow效果好,negtive-sample的skip-gram大都比skip-gram效果好。skip-gram大多数情况,也比cbow效果好。
    训练好的词向量各种分类啊,实体提取啊之类的比较,得出对negtive-sample方法有利的证据。
    然后就是各种数据的记录,曲线的绘制了,突出negtive-sample方法的速度性、高效性和准确率。
    科学实验嘛,工程嘛,重要的就是数据啦,这里容不得任何的作假,那是相当严格的,可不是文科那样的写写报告无病而呻那样的可比拟的。
    当然科研类实验嘛,那又是相当简单的,只要你给出的方法,你给出的数据,能够比当前的准确率高,即便没有什么道理,给不出什么理论,那也绝对是真理啊。
    科研嘛,最重要的当然是数据啦,数据是不会说谎的。
    就这样投入进去,时间过得很快,一下子就到深夜11点了,莫浩波终于记录下了他所需要的各种数据。
    接下来用这些数据,把原本论文的数据替换掉,很快,一篇关于自然语言词向量的论文,就大功告成了。
    借助英文-中文翻译,稍微改改其中语句不通顺的地方,中文论文也写好了。
    毕竟两三千字的论文,小菜一碟嘛,莫浩波轻松搞定。
    果断加上作者名,第一作者,当然是我们的莫浩波啦。第二作者,莫浩波果断地加上了思思的名字。
    他已经下定决心,一定要睡服思思,要和他一起选择这个“计算机科学与技术”的专业了。毕竟,生物工程什么的专业,听起来整个人都不好了,不能让她再次中奖了。
    弄完这些,便第二天早上5点了,顶着黑乎乎的眼圈,他沉沉地躺下了,就是早上日常的八点半闹钟,也激不起他的丝丝涟漪,果然变死猪了……

本文网址:https://www.3haitang.com/book/122092/35585497.html,手机用户请浏览:https://www.3haitang.com享受更优质的阅读体验。

温馨提示:按 回车[Enter]键 返回书目,按 ←键 返回上一页, 按 →键 进入下一页,加入书签方便您下次继续阅读。章节错误?点此举报