期刊网_中国期刊网

数据流聚类算法分析

作者：黄孝
学科：文化科学 > 教育学
创建时间：2007-05-15
出处：《池州学院学报》 2007年第5期

简介：　首先比较了数据流聚类分析与传统的聚类分析方法的一些不同点，对目前最新的一些数据流聚类研究成果进行了分析，最后对数据流聚类发展方向进行了展望。
标签：数据流模型聚类分析数据流聚类

全文阅读

一种基于谱分量相似度的多数据流聚类算法

简介：提出了一种新的多数据流聚类算法.该算法可以有效地对有相似行为但存在一定时间延迟的多数据流进行聚类.算法采用自回归模型技术度量数据流间的延迟相关,利用频谱估计来抽取数据流的特征.每一个数据流用其谱分量的和来表示,从而来计算每对数据流间的相关关系.每个谱分量用振幅、相位、衰减率、频率4个参数来描述.算法计算谱分量对之间的ε-延时相关关系,并以此为基础来得到聚类分析中数据流间距离的度量.此外,算法采用滑动窗口技术对多数据流进行聚类,实时地得出聚类结果且动态地调节聚类的个数.在人工数据集和实际数据集上的实验结果表明,所提出的算法比其他类似的算法具有更快的速度和更好的聚类效果.
标签：数据流聚类 AR模型谱分量

全文阅读

基于增量聚类的协流识别系统研究

作者：任群
学科：文化科学 > 教育学
创建时间：2018-01-11
出处：《西安文理学院学报：自然科学版》 2018年第1期

简介：云计算中的群集计算应用程序（例如MapReduce和面向用户的应用程序）具有应用程序级别的需求,因此需要有高级别的抽象来表示这些应用程序的需求.协流（coflow）是一个网络级别的抽象,用来表达数据并行编程范例的通信要求.协流使应用程序更容易地将其通信语义传达给网络,从而使网络能够优化常见的通信模式.然而,现有的协流识别方案依赖于修改应用程序,并不适用于多数实际场景.提出了基于增量聚类的协流识别策略,采用增量聚类算法来执行快速、透明的协流识别,实现了协流识别的自动化,同时无需对应用进行修改.仿真实验结果显示,本文的识别算法具有超过90%的准确率,具有一定的鲁棒性.
标签：数据中心网络协流增量聚类

全文阅读

基于概率分布的不确定数据聚类

简介：不确定性是数据的固有属性,在实验过程中由于仪器的限制或者收集过程中的误差都会造成数据的不确定性。数据挖掘算法在处理不确定数据的相关研究尚处于初级阶段,不确定数据聚类是不确定数据研究中的典型问题,已有一些聚类算法被应用到处理不确定数据,如UK-means等。无论是UK-means还是FDBSCAN都仅仅考虑了不确定数据之间的几何距离,而没有考虑到不确定数据之间的概率分布差异。然而,概率分布特征是不确定数据的本质特征,考虑不确定数据的概率分布能够更准确度量不确定数据间的距离,从而提高聚类算法的性能,本文使用核函数度量不确定数据与类中心的距离,然后使用UK-means算法聚类不确定数据,通过大量实验验证了本文提出的距离函数优于使用欧式距离期望的UK-means方法。
标签：不确定数据概率密度函数聚类 UK-means

全文阅读

基于横糊聚类的案例聚类算法研究

作者：张莉
学科：文化科学 > 教育学
创建时间：2009-04-14
出处：《教育与教学研究》 2009年第4期

简介：针对网络学习者及其对案例访问的模糊性提出采用模糊聚类的方法对学习者和案例进行聚类分析。在算法中，以各学习者对案例的访问次数、时间、学习效率等刻画学习者对案例的关注程度建立模糊相似矩阵，再由平方法求出模糊等价矩阵，然后进行聚类分析。通过具体实例阐述算法的计算过程，证明算法实现的可行性和有效性。
标签： WEB日志挖掘模糊聚类模糊集模糊等价矩阵

全文阅读

数据清洗下的改进半监督聚类入侵检测算法研究

作者：周志平;陈晓洁
学科：文化科学 > 教育学
创建时间：2017-03-13
出处：《武夷学院学报》 2017年第3期

简介：针对半监督聚类算法易受噪点的影响,提出一种基于数据清洗的改进半监督聚类算法DCSC。将噪点从数据集中提取出来另行分析。从数据清洗处理后的数据集中抽取若干正常与异常样本分别计算作为初始样本辅助K-Means算法进行聚类。实验结果表明,与现有相关算法相比,该算法具有检测未知攻击的能力,且具有更高的攻击检测率以及更低的误报率。
标签：数据清洗半监督聚类入侵检测

全文阅读

基于K-means文本聚类的中国大数据岗位需求分析

作者：邹启宇李康唐晨曦
学科：文化科学 > 教育学
创建时间：2022-04-19
出处：《教育学文摘》 2022年第1期
机构：山东英才学院 250104

简介：摘要：本文旨在通过k-means文本聚类了解国内大数据岗位需求特点，帮助企业和员工识别大数据人才，推动大数据相关研究的进一步发展。首先利用爬虫软件对招聘网“大数据”的招聘信息进行爬取招聘网站。然后利用解霸分词和K-means文本聚类对大数据招聘岗位进行聚类，聚类数由组内平均平方和确定。最后，将大数据岗位划分为10类，从整体数据集和聚类结果的角度对大数据岗位的城市分布、薪资水平、学历要求、经验要求等进行讨论和分析，明确大数据岗位的特点。大数据工作需求。分析结果表明，大数据的工作需求主要分布在一线城市和新一线城市。企业更倾向于大专或本科学历及一年以上相关工作经验的求职者。不同类型的工作之间存在工资差异。职位越高，对学历和经验的要求就越高。
标签：大数据 K-means技术岗位需求分析

全文阅读

基于kNN的聚类算法研究

作者：郑诚;俞青云
学科：文化科学 > 教育学
创建时间：2016-08-18
出处：《赤峰学院学报：自然科学版》 2016年第8期

简介：聚类分析在数据挖掘领域中占有重要地位,到目前为止学者们提出了许多的聚类算法.本文提出了一种基于kNN的聚类算法k-NearestNeighborCluster（kNNC）.该算法首先找到每个数据点的k个邻居点,然后设置匹配点数n,通过使用每个点的邻居点进行匹配进而达到聚类效果.本文通过三个实验去验证该算法,并且与k-means算法进行比较.实验结果表明,该算法具有稳定的正确率,而其最大的优点是不需要预先设定聚类簇数,它可以大致的找到聚类的簇数.
标签： KNN算法 K-MEANS算法聚类分析微博文本聚类

全文阅读

灰色聚类挖掘算法在山东黄河

作者：
学科：文化科学 > 档案学
创建时间：2011-04-14
出处：《科技档案》 2011年第4期

简介：一、前言随着信息技术的发展和山东黄河通信服务质量要求的提高，档案的种类、载体形式日趋多样化，科学地管理档案及档案信息资源的有效开发利用迫在眉睫．传统的黄河通信档案资源利用，仅局限于信息检索查询，
标签：山东黄河挖掘算法灰色聚类档案信息资源通信服务质量信息技术

全文阅读

基于Sollin算法的快速聚类研究

作者：刘欢
学科：文化科学 > 教育学
创建时间：2015-01-11
出处：《船舶职业教育》 2015年第1期

简介：文本聚类技术作为处理和组织大量文本数据的一项重要技术，能够在很大程度上解决由于信息爆炸所带来的问题。Sollin算法是构建最小生成树的典型算法，与Kruskal算法和Prim算法相比，具有容易实现并行运算的特点。因此，利用基于Sollin的快速层次聚类算法在复旦语料和搜狗语料上进行聚类实验，结果表明基于Sollin的快速层次聚类算法在运行效率和聚类质量上都优于传统层次聚类算法。
标签：层次聚类 Sollin算法运行效率聚类质量

全文阅读

应用动态聚类划分经济区域

作者：黄启亮
学科：文化科学 > 教育学
创建时间：1990-03-13
出处：《广东第二师范学院学报》 1990年第3期

简介：聚类分析是数理统计中研究“物以类聚”的一种方法。近十几年，随着数理统计的多元分析方法的迅速发展，多元分析的技术便被引进到分类学中来，并形成聚类分析这个新的分支。聚类分析目前已广泛应用于自然科学研究领域，比如考古、地质、化学、生物等等。实际上，对经济管理、社会统计等部门的社会经济问题，也都可以应用聚类分析的方法来进行研究。
标签：经济区域聚类划分应用聚类分析社会经济问题数理统计

全文阅读

基于均值聚类的劳务众包定价模型

作者：郭子健1，2门晓君1，2丁尚尚1，3钟丽1，4
学科：文化科学 >
创建时间：2017-12-22
出处：《建筑科技》 2017年第14期
机构：1.华北理工大学数学建模创新实验室河北省唐山市063210

简介：摘要在移动“互联网+”的时代，为了更加方便快捷的进行信息搜集和商业检查，一种自助式劳务众包平台服务模式“拍照赚钱”应运而生。
标签：

全文阅读

基于土壤肥力研究的核聚类算法

作者：南楠
学科：文化科学 > 职业技术教育学
创建时间：2009-04-14
出处：《三门峡职业技术学院学报》 2009年第4期

简介：提出一种将改进的核函数应用于土壤肥力研究的聚类方法。该方法在K-means聚类算法的基础上加入核函数,简化目标函数,将数据从低维空间映射到高维空间增加样本特征差异,同时提出相应选取参数的标准,提高聚类效果。实验表明,该算法对于非凸型数据或多维数据聚类正确率较高,具有良好的性能,能较好地反映土壤肥力指标和土壤利用的关系,可使土壤肥力的发展与作物的需求达到协调一致的状态,保障农作物的高产稳产。
标签：土壤肥力土壤养分 K-MEANS算法核函数

全文阅读

基于聚类的电网监控信息辨识方法研究

作者：罗建宇
学科：文化科学 >
创建时间：2018-03-13
出处：《科技中国》 2018年第3期

简介：本文提出一种基于聚类的电网运行监控信息辨识分类方法，其特征在于，以大量的电网运行监控信息为基础，按照监控信息发出时间为依据进行分段，将原本连续的监控信息切分成多个文本，而后采用统计学的方法对文本进行预处理形成对应特征向量，并通过数据挖掘的方法对特征向量集合进行聚类分析得出聚类规则。最终实现对监控信息的自动辨识分类功能，辅助电网监控人员及时发现设备发出的告警信号，维护电网安全稳定运行的目的。
标签：

全文阅读

基于频繁项目集的多隶属聚类算法

作者：范全润;田林
学科：文化科学 > 教育学
创建时间：2004-03-13
出处：《楚雄师范学院学报》 2004年第3期

简介：通过分析目前的聚类算法,提出了多隶属聚类的概念;提出了一种基于频繁项目集的多隶属聚类算法,该算法能产生事务型数据的多隶属聚类.
标签：聚类多隶属聚类频繁项目集

全文阅读

关联规则聚类的外贸业务交叉销售系统设计

作者：林柏双
学科：文化科学 > 高等教育学
创建时间：2009-01-11
出处：《福建工程学院学报》 2009年第1期

简介：叙述外贸业务过程与交叉销售系统流程,说明外贸业务交叉销售关联规则聚类系统的基本结构,简述关联规则与ISODATA模糊聚类分析原理,着重介绍ISODATA模糊聚类分析的分类数c与初始模糊分类矩阵Rc^（0）的获取,以及利用其更准确建立交叉销售经营类别库与商品规则库的初始数据。
标签：模糊聚类外贸业务关联规则交叉销售

全文阅读

基于SSAS聚类方法的读者借阅行为实证分析

作者：杨昌顺
学科：文化科学 > 教育学
创建时间：2012-03-13
出处：《兴义民族师范学院学报》 2012年第3期

简介：SSAS聚类分析是MicrosoftSQLServerAnalysisServices（SSAS）数据挖掘平台提供的一种重要的数据分析方法,该方法使用迭代技术将数据集中的事例分组为包含类似特征的分类。在聚类方面,SSAS提供了K-means算法和ExpectationMaximization算法,其中这两种算法又分为可缩放和不可缩放两种类型。SSAS聚类分析方法在图书馆的读者行为分析中具有较强的可操作性和实用性。
标签：聚类分析法 SSAS 图书馆读者

全文阅读

一种改进的灰色聚类综合评价方法

简介：在传统白化权函数的基础上,进一步向两侧延伸聚类指标的取值范围,构建一种改进的白化权函数,进而生成一种新的灰色聚类评价方法.利用新的灰色聚类评价方法对教辅人员工作情况进行分析、计算,得到教辅人员工作评价结果,为教辅人员的选拔、聘任和评价提供量化依据.
标签：灰色聚类聚类系数白化权函数工作评价

全文阅读

聚类法模糊系统建模的研究与进展

简介：二十世纪九十年代以来,模糊系统的研究与应用得到快速地发展。从输入-输出数据出发建立模糊系统也成为控制领域一个研究热点。本文综述并分析了二十年来聚类法模糊系统建模研究的重要成果,并指出了进一步的研究方向。
标签：模糊系统模糊系统建模模糊聚类减法聚类 G-K模糊聚类算法

全文阅读

运用系统聚类法对高校学生进行分类

作者：刘映池;张毅
学科：文化科学 > 教育学
创建时间：2009-09-19
出处：《教育与教学研究》 2009年第9期

简介：学生管理是学校教育的重要组成部分,清晰认识学生自身特点是对学生实施有针对性管理的前提。可以运用系统聚类法中的最短距离法,按学生的思想品德、学习成绩、身心健康三项指标将学生分成四类,即优、良、中、一般,从而为学生管理工作者根据分类结果对不同类型的学生实施有针对性的管理提供科学依据。
标签：系统聚类法最短距离法学生管理

全文阅读