第十八章 语义识别的难点(1 / 2)

加入书签 本章报错

科技大崛起强烈推荐: 洪荒魔鼎 每次醒来都在案发现场 倾城皇妃不夺宠:独占君心 天机勿语 做鬼是个技术活 我要了我的女儿 邪魔DE伪天使 吾妻多娇 梅次的故事

这个帖子在短暂的沉寂之ใ后,突然火了起来引起关注。

宁熙言的这种安排和国内一切讲资历的情况迥然不同。在国内更多的是讲资历,有没有能ม力不重要,只要资历够老就能担任一些重要职位。这种观念对刚从国外回来的宁熙言而言是很难接受的,她无法改变国情,但是却可以改变这家公司。

关键是不要钱

这可不是什么好事,隔三差五的通宵对身体有多不好,不用说也知道。宁熙言决定让罗辑去睡觉,再这么下去公司还没开张,董事长就先垮了。

他们一般会选择边吃饭边谈工作,没有食不言的忌讳,毕竟都是慢条斯理的吃法怎么都行,可偏偏现在出了个奇葩。

想了想罗辑决定将这些人文科学丢给别人,比如宁熙言,她大概会感兴趣。

其实罗辑还有一个想法,那就是在时代进步之后,他对于超过时代的研究也会轻松不少,以后会怎么样谁又说的清呢?

肯定要换成语音,一个能理解语义的智能。小音的声音从哪解决?罗辑看了眼身前๩微微喘气的女生,一个不错的选择

上课睡觉的人不是没见过,但坐在第一排中ณ间睡觉的还是第一次见,这让任课老师有些哭笑不得,她何尝看不出来这个同学实在困的厉害,不过看在他还只是坐着睡觉的,没有直接躺在桌子上,这个ฐ老师๲决定小施惩罚,剩下还有一点时间就让这个同学来发言了。

“你觉得呢?”宁熙言没有正面回答,反问了一句。

“啊?这不可能ม你回一趟家有这么闲吗?都看起科幻电影了。”

“这得一百多万吧”路虎普通版也就这个价格,不过说话的明显没有看明白。

脑海里的知识说,这理论上可以达到เ十五米。不过按真实情况来看,肯定是不行的。罗辑看着被搬到室外的那个充电å发射器,有种胡拼乱凑的感觉,怎么看也到不了极限值。

注意力向下探去,一个名为“工业时代”的树枝吸引了罗辑的目光。这个时代始于十九๡世纪,现代很多工业体系都是在那ว个时候建立的,机械组装知识绝对有很多。

“请问你是我的主人吗?”

“找到了”

“那边就是那堆挂着铜线圈的地方。”

再次点击一回树叶后,朱成没在继续下去,开始浏览起信息来。

点击树叶之后,出现的一根树枝的放大版。与简单的首页ษ不同,这个二级页面中多了很多信息。

“智能小语10七天后正式上线”朱成很快就看到了顶端的信息。

“暂时推出的软件分个人版和企业版。个ฐ人版免费使用,企业版有为ฦ期七天的试用期。”

在软件的下方还分别有个简介。个人版对于生活方面的识别会更加精准,而企业版更注重于会议,可支持多人同时录入,抗噪音能ม力也更强,并且还可以选择去口语化,使会议内容更接近书๰面格式。

网页里面的信息不多,很快朱成就看完了。对于七天后软件的发布๧十分期待,语音录入可是懒人必备的神器啊,以后估计都不用打字了。

“智能小语,也๣可以叫语音输入法吧”

如果不用打字了,是不是意味着键盘也没用了那笔记本岂不是可以做的更薄不对,没了键盘不就成了平板么朱成想到了这一点,感觉自家的电脑แ城可以多进一些平板电å脑了。

在外界因为ฦ语音识别而震惊的时候,罗辑所在的机房却只能ม听到敲键盘的声音。尽管语音识别已经做了出来,但对于写代码而言意义不大。真正能将罗辑从这些繁重的任务中解救出来的只有语义แ识别

开发语义แ识别ี,就如同罗辑预料的那ว样,并不是一块好啃的骨头。

更何况是中ณ文体系上的语义识别,这比其它语言要难上几个级别。光是分词这一项,就能让人死掉不少脑细胞。中文不同于单词组成的拉丁文,拉丁文单词间的空格可以大幅度减少电脑的识别难度,而中文却不行。

在中文里面,一句话就有很多意思。别说电å脑了,有时候就连人也๣不好分辨。比如那ว句著名的“下雨天留客天天留我不留แ”,在没有标点符号的情况下,它至少有七种意思。对于电å脑而言,别说这种地狱级的分词,哪怕是一些人们看来再简单不过的句子也很难分辨。

比如“华科大学生前来应聘”,电脑可能会理解为ฦ“华科大学,生前๩,来应聘”。

中文语义识别的第一个难点,也可以说是最大的难点便在这里。怎样的分词算法才是最完美的

罗辑在科技树中找到เ了方案,一种基于统计学模型的算法,构建一个三维矩阵,选取概率最高的一个。xy轴是任意两个词语的组合,而z轴则是场景状态,根据语气和语态选取的最佳方案。

“不过这需要联网。”罗辑琢磨了一下,这似乎是目前最好的方แ案,虽然他的本意是打造一个ฐ可用于线下服务的智能,但是以现在的设备存储能ม力想要存下大量的语料é库,根本就是天方夜谭。电脑肯定是不行的,光脑还差不多。

“联网就联网吧,在程序里预留一些常用算法,断网勉强也๣能用。”

解决了第一个问题之ใ后,罗辑又陷入了瓶颈。他蓦然想起中文还有一点很蛋疼,那就是没有和英文一样可用于区分人名地名的大小写。

↑返回顶部↑

书页/目录

科技大崛起推荐阅读: 歌词你是走了还是隐身了 重生之公子种田天下第九 无限传说结局 海贼王之吾为恶魔免费下载 绣口锦心打一动物 矿工的铃珠 大唐寻芳谱 浴血黑帮第三季 启魂录 小说江山美人娇