第十八章 语义识别的难点(1 / 2)

加入书签 本章报错

科技大崛起强烈推荐: 悬爱疑情1,总裁深情不悔 名门婚爱,高冷老公太任性 穿越重生之狗血人生 摄影尸 有一家农庄 三国神赋师 末世权力 混血妖也有春天 月下的恶魔城

“楼上说的很对,现在的语音识别效率偏低,不是很实用。”

罗辑的这两项ำ技术无疑会改变世界ศ,并且将超越公司推向一个ฐ不可思议的高度。而到了那个时候,仅凭罗辑一人是无຀法解决所有的问题的,因此在未来肯定要成立研究院。在宁熙言的设想中,这个研究院一定是以研究人员为主,行政人员为辅的机构。

宁熙言白了罗辑一眼,矿泉水?你可是要开大公司的人,这么เ做太丢分了。

不过在她正准备出声的时候,罗辑却先她一步开口了。

罗辑有些不太好意思,要怪只能怪这些套餐分量太少了,那么大的盘才装一点点糊弄谁呢?不过在摸了摸丝毫不减鼓起的肚子之后,罗辑还是点了点头,反正这顿不是他请。

正想着什么时候打个电å话来着,就听到了门外的刹车声,抬头一看正是那辆霸气的suv。

“无线充电器搭载智能核心,将更多的设备无线化智能化,还有更加小型更加灵敏的传感器,以及真正的智能ม助理……”

“同学你有考虑当声优吗?”罗辑没等她先说话,就以前问了出来。

“发言?什么发言?”罗辑完全傻眼了,完全没听说这回事啊。

“嗯……那个ฐ唐杰是你公司的?”

“见过,谷歌的智能猫嘛,有大数据和云计算支持,没什么好惊讶的。”

很快就有嗤笑声从旁边传了过来“没见识,看到后面周年标志没有,这是限量版,得三四百万呢关键是这还不是你有钱就能ม买的到的”

罗辑摇了摇头,并没有放在心上。

“这……”

沉默了一会,罗辑迟迟按下键盘。因为他不知道应该说些什么。面对这可能ม是世界上一款真正的人工智能,罗辑有些迷茫了。或许不能将它当成一个ฐ工具,而是一个生命,一个还未长大的生命,应该称为……“她”吧

就在罗辑感觉自己有些头晕目眩的时候,他终于找到了自己想要的结果。一种基于现在计算机所能ม达到的最高程度,而设计出来的语言,专门为ฦ人工智能设计的语言。

“据说是什么无线充电技术之ใ类的,不过你也看见了,那玩意就算真能无线充电,也๣没有前景,既ຂ不方แ便携带又要调整角度,还浪费资源。系里面都说没有前๩景,也就他还在研究,真是死脑แ筋。”

再次点击一回树叶后,朱成没在继续下去,开始浏览起信息来。

点击树叶之ใ后,出现的一根树枝的放大版。与简单的首页ษ不同,这个二级页面中ณ多了很多信息。

“智能小语1้0七天后正式上线”朱成很快就看到了顶端的信息。

“暂时推出的软件分个ฐ人版和企业版。个人版免费使用,企业版有为期七天的试用期。”

在软件的下方还分别ี有个ฐ简介。个人版对于生活方面的识别会更加精准,而企业版更注重于会议,可支持多人同时录入,抗噪音能力也๣更强,并且还可以选择去口语化,使会议内容更接近书面格式。

网页里面的信息不多,很快朱成就看完了。对于七天后软件的发布十分期待,语音录入可是懒人必备的神器啊,以后估计都不用打字了。

“智能小语,也可以叫语音输入法吧”

如果不用打字了,是不是意味着键盘也๣没用了那笔记本岂不是可以做的更薄不对,没了键盘不就成了平板么朱成想到了这一点,感觉自家的电脑城可以多进一些平板电脑แ了。

在外界ศ因为语音识别而震惊的时候,罗辑所在的机房却只能ม听到敲键盘的声音。尽管语音识别ี已经做了出来,但对于写代码而言意义不大。真正能将罗辑从这些繁重的任务中解救出来的只有语义识别

开发语义识别,就如同罗辑预ไ料é的那样,并不是一块好啃的骨头。

更何况是中文体系上的语义识别,这比其它语言要难上几个级别。光是分词这一项ำ,就能让人死掉不少脑细胞。中文不同于单词组成的拉丁文,拉丁文单词间的空格可以大幅度减少电脑แ的识别难度,而中文却不行。

在中文里面,一句话就有很多意思。别说电脑แ了,有时候就连人也๣不好分辨。比如那句著名的“下雨天留客天天留แ我不留”,在没有标点符号的情况下,它至少有七种意思。对于电脑แ而言,别说这种地狱级的分词,哪怕是一些人们看来再简单不过的句子也很难分辨。

比如“华科大学生前๩来应聘”,电脑แ可能会理解为“华科大学,生前,来应聘”。

中文语义แ识别ี的第一个难点,也๣可以说是最大的难点便在这里。怎样的分词算法才是最完美的

罗辑在科技树中找到了方แ案,一种基于统计学模型的算法,构建一个三维矩阵,选取概率最高的一个。xy轴是任意两个词语的组合,而z轴则ท是场景状态,根据语气和语态选取的最佳方案。

“不过这需要联网。”罗辑琢磨了一下,这似乎ๆ是目前最好的方案,虽然他的本意是打造一个可用于线下服务的智能ม,但是以现在的设备存储能力想要存下大量的语料库,根本就是天方夜谭。电å脑肯定是不行的,光脑还差不多。

“联网就联网吧,在程序里预留一些常用算法,断网勉强也能ม用。”

解决了第一个问题之后,罗辑又陷入了瓶颈。他蓦然想起中文还有一点很蛋疼,那就是没有和英文一样可用于区分人名地名的大小写。

要是仅仅这样也就罢了,关键是有些人的名字起就是一个词语,如果分词程序有智能的话,它一定会把这些人拖出去砍死。比如高峰、汪洋、罗辑

“这还是不要砍死了,半残就好。”

罗辑马上停止了抱怨了,再困难也๣要解决不是

“到底要怎么做”

罗辑觉得自己้有些天真了,一开始以为有了科技树绝对可以快速的解决问题,可事实上并非如此。之前做无线充电器时,都要用到机械方面的知识,而难度比无຀线充电更大的语义แ识别,其交叉的学科只会更多。

“语义识别要什么电脑编程、统计分析、数据建模还有语言学”罗辑看到科技树上显示的内容完全傻眼了,前面的只要的理科内容,不管多难他都不怕,可偏偏最后一项ำ他却没有办法。

让罗辑去看文科知识,那ว比杀了他还难受。可不学语言学,怎么可能做的出语气识别ี

罗辑抓破脑袋也๣没有想出代替方案,这似乎ๆ是唯一的解决方法。想想也是,对语言不熟ງ悉的人又怎么做的出语义识别作为社交白痴的罗辑,自己้都听不太明白别人的话,又怎么让电脑也“听”的懂

学习语言学

罗辑硬着头皮只看了一会,就感觉头大如斗,就像熬了好几个ฐ通宵,困意如潮水般一涌来,怎么也挡不住。

这道是个催眠的好方法,罗辑有些哭笑不得。

“只能走一步看一步了。”罗辑决定先将这个问题搁置,等其他能解决的都解决了,再回头来考虑这个问题。

先搭建模型吧。

↑返回顶部↑

书页/目录

科技大崛起推荐阅读: 噩梦宝藏怎么停更了 豪门重生手记txt下载 重生我的火影之路txt 杨小落的便宜奶爸百科 东京调制模式小说 都市最强狂兵李天正版免费阅读 玩转时空的超人下载 史记霍去病传 总裁酷帅狂霸拽txt下载 美味大唐结局