简介:传统针对文本数据的分析,往往基于词频、词频逆文本统计量作为文本的表示特征.这类方法往往只反映了文本的部分信息,忽略了文本的内在语义特征.本文研究了中文词语衔接的概率语言模型,其基本思想在于根据文本中词语出现的先后顺序进行建模分析,该模型在短文本数据挖掘中能够很好地针对文本语义进行量化分析.主要解决两类问题:一、如何合理地将中文词转化为数字向量,并且保证中文近义词在数字空间特征上的相似性;二、如何建立恰当的向量空间,将中文文本的语义和结构特征等信息保留在向量空间中.最后结合某城市房屋管理部门留言板的实际留言文本数据,利用BP神经网络和RNN网络两种算法,实现概率语言模型的求解.与传统文本处理方法的对比说明,本文的模型方法针对短文本语义挖掘问题具有一定的优势性.
简介:对静态机器人避障问题进行了全面分析,对最短路的设计进行了理论分析和证明,建立了机器人避障最短路径的几何模型,对最短时间路径问题通过建立非线性规划模型,有效地解决了转弯半径、圆弧圆心位置和行走时间等问题.
简介:对于三机器自由作业加工总长问题,如果工件仅有两个到达时间,我们证明了稠密时间表的性能比为5/3。
简介:研究描述单模光纤中光孤立子传播的具光纤损耗项的三阶非线性Schrodinger方程,首先证明了整体解的存在唯一性结果,然后证明其长距离行为由紧的整体吸引子刻画,并给出了吸引子的Hausdorff维数和分形维数的上界估计,最后研究了吸引子的正则性.