学科分类
/ 25
500 个结果
  • 简介:摘要本文分析了汽车行业基于不同思想的各类大数据算法,用户应该根据实际应用中的具体问题具体分析,选择恰当的算法。算法具有非常广泛的应用,改进算法或者开发新的算法是一件非常有意义工作,相信在不久的将来,算法将随着新技术的出现和应用的需求而在汽车行业得到蓬勃的发展。

  • 标签: 汽车 大数据 聚类算法 划分
  • 简介:摘要双(Biclustering)算法在数据挖掘中是一个新兴的算法,对于矩阵类型的数据,其效果很好。本文浅述了双算法的基本特点,并提出了用迭代的双算法对未知的数据进行分类,并对一组数据进行了测试,其分类表现不错。

  • 标签: 双聚类 数据挖掘 迭代 分类
  • 简介:摘要本文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进k-prototypes算法,使该算法满足不同要求的混合属性数据,最后通过C#语言,在ArcEngine2010版本上实现。

  • 标签: K-prototypes算法 混合属性 类型数据 相异度系数 加权属性
  • 简介:关系数据的算法对于传播研究意义重大,首先运用迭代系统隐喻个体结构的变化,用输出与状态的包含距离表示关系的非对称同时也确定拥有最高结构等级序列的节点来代表簇;再将Hausdorff距离引入DBSCAN算法,使得同结构节点进行合并的加和算子和层次上卷的并算子变得可压缩。运用复杂网络研究人员的数据对算法的有效性进行了评估,分层后的人员合作网具有不同的网络结构特征;关键词在层次2网络中的传播效率高;互惠关系在知识传播中的作用最大。新的发现证明算法通过引入Hutchinson算子的可压缩测度Hausdorff距离使得网络结构对传播效果的影响得以体现,该算法的设计思路是正确的。

  • 标签: 关系的非对称性 HAUSDORFF距离 并算子 凝聚层次聚类
  • 简介:针对推荐系统的准确性提出了一种优化算法,该算法首先利用用户的特征进行,然后在之后的各个簇中运用混合协同过滤框架为每个簇训练一个模型;同时在运用混合协同过滤时,针对传统的基于用户的协同过滤推荐算法在计算用户相似度方面进行了改进.实验表明,提出的优化算法显著提高了预测的准确性,从而提高了推荐结果的质量.

  • 标签: 特征聚类 协同过滤 计算用户相似度 一致评分矩阵 混合模型
  • 简介:不确定性是数据的固有属性,在实验过程中由于仪器的限制或者收集过程中的误差都会造成数据的不确定性。数据挖掘算法在处理不确定数据的相关研究尚处于初级阶段,不确定数据是不确定数据研究中的典型问题,已有一些算法被应用到处理不确定数据,如UK-means等。无论是UK-means还是FDBSCAN都仅仅考虑了不确定数据之间的几何距离,而没有考虑到不确定数据之间的概率分布差异。然而,概率分布特征是不确定数据的本质特征,考虑不确定数据的概率分布能够更准确度量不确定数据间的距离,从而提高算法的性能,本文使用核函数度量不确定数据与中心的距离,然后使用UK-means算法不确定数据,通过大量实验验证了本文提出的距离函数优于使用欧式距离期望的UK-means方法。

  • 标签: 不确定数据 概率密度函数 聚类 UK-means
  • 简介:本文提出一种基于的电网运行监控信息辨识分类方法,其特征在于,以大量的电网运行监控信息为基础,按照监控信息发出时间为依据进行分段,将原本连续的监控信息切分成多个文本,而后采用统计学的方法对文本进行预处理形成对应特征向量,并通过数据挖掘的方法对特征向量集合进行聚类分析得出规则。最终实现对监控信息的自动辨识分类功能,辅助电网监控人员及时发现设备发出的告警信号,维护电网安全稳定运行的目的。

  • 标签:
  • 简介:摘要针对网络数据的海量性和相对无序性,定义了多层次话题语义结构模型,基于多层次话题语义模型,对经典的SinglePass算法做出了改进,包括使用子话题质心来代表子话题内的文档、AverageLink比较策略、进行类似于K均值算法的重调整的方法、子话题和话题的双层次语义结构。在实验过程中对比了在线话题的算法的性能,确定了层次化在线话题方法,形成有机统一的热点话题模型,具有较高的应用价值和研究价值。

  • 标签: Single Pass 话题 聚类 语义结构
  • 简介:摘要本文以城市群为研究对象,针对城市群进行四阶段交通需求预测的基础研究,提出在交通小区划分时,以密度法为算法,提出一种有利于准确构建城市群交通模型的交通小区划分方法,同时对在交通小区划分时涉及到的城市群交通数据挖掘提出优化方法。

  • 标签: 交通小区划分 四阶段交通需求预测 密度聚类法
  • 简介:摘要技术作为当前应用最广泛的静态数据分析技术之一,在多个领域发挥着重要作用,特别是在金融投资方面。俗话说物以类聚、人以群分,就是相似的元素,就是把相似的元素聚在一起,相当于一个集合。聚类分析技术就是研究分类问题的一种统计分析方法。在进行金融数据分析时,我们经常会使用到技术,并且分析结果意义重大,例如对股票的涨势、收益进行分析,能够为投资者提供投资范围和价值,帮助投资者把握股票的整体特点,为投资者的投资决策提供依据。本文主要讨论在是技术在金融数据分析中的应用。

  • 标签: 聚类技术 金融 数据分析
  • 简介:借助K-means算法等数据挖掘技术,从我国博士研究生招生实际状况入手,从博士招生的结构质量、生源质量和选拔质量等角度分析研究生招生质量,提出科学合理的优化选拔方式、提升生源质量的博士生招生方案,对博士研究生招生单位具有良好的借鉴意义。

  • 标签: 博士 招生 质量 聚类技术
  • 简介:云计算中的群集计算应用程序(例如MapReduce和面向用户的应用程序)具有应用程序级别的需求,因此需要有高级别的抽象来表示这些应用程序的需求.协流(coflow)是一个网络级别的抽象,用来表达数据并行编程范例的通信要求.协流使应用程序更容易地将其通信语义传达给网络,从而使网络能够优化常见的通信模式.然而,现有的协流识别方案依赖于修改应用程序,并不适用于多数实际场景.提出了基于增量的协流识别策略,采用增量算法来执行快速、透明的协流识别,实现了协流识别的自动化,同时无需对应用进行修改.仿真实验结果显示,本文的识别算法具有超过90%的准确率,具有一定的鲁棒性.

  • 标签: 数据中心网络 协流 增量聚类
  • 简介:摘要分析了C油田A二油层驱注后期含水回升期存在的主要问题,即聚合物突破后,层间矛盾加剧,薄差层动用程度差,加之聚合物的清污混注,使区块含水上升过快,目前综合含水达到94.8%,并制订实施综合调整措施,含水回升速度得到控制,区块开发效果明显改善。

  • 标签: 二类油层 注聚后期 含水上升
  • 简介:摘要聚合物驱油已成为大庆油田稳产、持续发展的重要技术,针对二油层上返注的特点,本文通过探索优质高效的聚合物注入管理方法,使地面工程更好地满足地质开发的需要。

  • 标签: 二类油层 优质高效 聚合物 注入 管理
  • 简介:针对海底采样点较少时,监督学习训练分类模型困难的问题,研究无监督学习的K-均值聚类分析算法在多波束海底底质分类中的应用。在探讨K-均值聚类分析算法原理的基础上,构建海底底质分类器,针对分类器需预先输入分类结果种类(K值)这一问题,提出了基于底质采样点和分类效果连续性为原则的K值确定方法。实验结果表明:基于K-均值聚类分析算法的海底底质分类器能较好的实现海底底质类型的自动划分,适用于海量多波束底质特征参数的分类。

  • 标签: 多波束测量 海底底质分类 特征参数 K-均值算法 聚类分析
  • 简介:摘要随着经济的快速发展,电能需求量越来越大,高效调节系统负荷的能力成为供电公司日趋关注的重点。用户的用电行为对于平衡供求关系,确保电力系统的可靠性具有重要意义。以用电信息采集系统中配变负荷数据为基础,结合K-Means聚类分析方法,对乡镇区域公变负荷曲线进行,研究地区电力用户负荷模式,为公司配电网运维决策提供科学的参考依据,对优化地区电网建设及规划具有极其重要的意义。

  • 标签: 聚类 实时负荷 用电信息采集
  • 简介:发展模式选择对绿色食品产业产生重要影响,从路径上决定产业资源分配和使用,因地制宜利用现有优势资源,可以加速产业发展。本文从绿色食品产业发展模式选择进行研究,通过引入聚类分析模型,对我国各地绿色食品发展模式进行,找出绿色食品产业发展模式的相同性特征及发展规律,并引入5个中国农业经济先进发展省份数据迁行比较分析,找出绿色食品产业最优发展模式。

  • 标签: 绿色食品 发展模式 聚类分析
  • 简介:摘要本文以广西桂林市漓江景区和阳朔西街景区附近403家酒店作为研究对象,运用K-Mean聚类分析,分别从酒店的用户体验、服务环境、酒店价格和酒店规模四个总体指标对酒店的类型进行综合评价。研究发现,分类状况和美团网上酒店标记类型基本一致,表明广西桂林市漓江和阳朔西街景区的酒店整体运营与服务环境以及用户体验大体上使人满意,以及应用K-Maens聚类分析对酒店的综合评价具有可行性。

  • 标签: K-Mean聚类 酒店类型 综合评价
  • 简介:随着"创客"一词首次被写入2015年政府工作报告,创客运动席卷全国。创客教育作为创客运动的"衍生产品",以其创新性视角及"做中学"的理念而被大众所熟知。文章使用书目共现分析系统Bicomb2.0提取国内创客教育相关研究的高频关键词并进行词频分析,构建共词矩阵及词篇矩阵,利用社会网络分析工具NetDraw绘制高频词汇的国内创客教育共词网络图,使用SPSS统计分析工具进行关键词聚类分析和多维尺度分析,进而对国内创客教育研究的重要主题进行分析并提出国内创客教育面临校园创客教育"本土化"、创客教育理论体系及课程体系建设、创客教育优秀师资队伍培养、创客教育实施的评价指标体系构建四大挑战。

  • 标签: 创客教育 聚类分析 词频分析 共词矩阵 可视化网络关系图
  • 简介:摘要本文主要分析了面向灰色法的卢瑟建筑设计方案评估,阐述了在当前形势下,加强绿色建筑设计方案评估的重要性。笔者通过研究,总结和归纳自身多年工作经验,提出构建绿色建筑设计方案评价指标体系的方法。希望通过本文的分析能帮助相关绿色建筑设计单位提高设计方案评估工作水平和质量,能更好地应对工作中存在的问题。

  • 标签: 灰色聚类法 绿色建筑 设计方案评估