第302章 自然语言处理 (第2/3页)
关于这方面的研究情况.然后又说了国内的研究情况:“咱们国内对这方面的研究.相比国外.还处于一个水平更低的基础信息积累阶段.一方面是因为国内的起步比西方晚.二來.是因为.中文和西方拉丁语系的那些语言有很大不同.拉丁语系是拼音语系.而且句式本身就是结构化的.所以计算机处理起來也相对容易.但是中文却是一种古老的象形文字.句式灵活随意.充满了各种虚词助词.想将这样的语言转化成计算机可以分析处理的形式.本身就是一个很大的难題.”
“嗯.这倒是事实.那么咱们国家现在的研究状况究竟是什么样子的.”听了老妈的话.肖远稍稍有些失望.前世他也只是稍稍关注过这方面的理论.具体的细节了解也不是太多.于是就想更深入的了解一些.
“现在国内进行这方面研究的.主要是几个大学.其中京华大学的研究比较前沿.国内其他大学在这方面的研究.也大都在配合京华大学的研究.做一些基础词库整理工作.妈的实验室也有人在做这方面的研究.主要承担的是H到P的词汇整理建库工作.目前完成度已经到百分之八十了.”杨静宸说道.
听了杨静宸的介绍.肖远说道:“基础词库大概什么时候能够建好.”
“这个很难估计.”杨静宸说道.说完看到肖远眉头皱了起來.又说道.“你要真的想在搜索引擎中使用自然语言处理算法.妈倒是能给你一些建议.”
肖远用询问的目光看着老妈.等着她继续.
“人们要利用你说的搜索引擎在网上检索信息的话.我想他们用的最多的.肯定不会是完整的句子.而是一些关键词.或者一些短句.仅仅分析关键词和短句的话.难度就沒有那么大了.而且你也沒必要一下子就把产品做的那么完美.人们以前从來沒有接触过这样的产品.所以.只需要一些简单的智能性.就足以对用户产生足够的吸引力了.”杨静宸说道.
肖远点了点头.说道:“这个我自然是知道的.不过咱们国内的研究状况让我有些失望罢了.第一版
(本章未完,请点击下一页继续阅读)