福州大学城论坛

 找回密码
 立即注册
开启左侧

中国工业电器网(2020-02-10):电气百科:网络流量数据缺失?新算法可减少误差,提升 ...

[复制链接]
发表于 2023-3-17 12:55:03 | 显示全部楼层 |阅读模式 来自 LAN
中国工业电器网(2020-02-10):电气百科:网络流量数据缺失?新算法可减少误差,提升数据恢复的精确度<hr>发布日期:  2020-02-10                            作者: 本站编辑                            阅读: <hr>福州大学物理与信息工程学院的研究人员汪灿、冯心欣,在2019年第12期《电气技术》杂志上撰文指出(论文标题为“基于交替最小二乘法的时空张量填充算法”),在网络系统中,无论采用何种流量测量系统,都无法避免数据的丢失。为解决网络流量数据的缺失问题,本文提出了一种基于交替最小二乘法的时空张量填充算法以恢复流量数据张量中的缺失值。
本文提出的算法不仅利用了张量分解及其低维表示,还充分考虑了网络流量数据的时空相关性,进一步提高了数据恢复的准确性。本文使用Abilene数据集对算法进行测试,并与现有的填充方法进行对比。实验结果表明,本文提出的方法能够有效地减少流量数据恢复的误差,提升了数据恢复的精确度。
网络流量数据是实现更好的网络管理的必要条件,作为整个网络的概述,它是许多网络任务的关键输入参数,如流量工程、容量规划和异常检测。由于流量测量系统受硬件和传输的影响,在采集过程中,不可靠的连接和传输协议造成流量数据结构丢失。如何有效地处理这些缺失数据仍然是一个挑战。因此,准确地从流量数据中恢复缺失值非常重要。
目前,数据填充算法主要包括基于机器学习的K近邻法(K-nearest neighbors, KNN)等,基于矩阵的稀疏正则化矩阵分解(sparsity regularized matrix factorization, SRMF)和奇异值阈值算法(singular value thresholding, SVT)等,以及基于张量的张量最小交替二乘法(tensor alternating least squares, TenALS)和低秩张量填充算法(tensor matrix completion, TMac)等。
在对网络流量的缺失数据进行处理时,上述方法都存在着一些缺点。例如,K近邻法需要大量的历史数据,造成计算量过大;基于矩阵的方法不能利用数据的多维特性,导致数据恢复的精确度仍然较低;基于张量的方法没有充分考虑数据潜在的时空相关性,无法达到令人满意的恢复结果。
交替最小二乘法是矩阵分解中使用的一种算法,它能有效地估算稀疏矩阵中的缺失值,因此,在众多领域中得到广泛应用。如,运用多元曲线分辨-交替最小二乘法(multivariate curve resolution- alternating least squares, MCR-ALS)研究各种药物之间的相互作用,以及在Spark框架下利用交替最小二乘法优化各种推荐算法等。
时空张量(矩阵)填充算法利用数据之间的时空相关性来提高缺失数据的恢复准确性。如,Roughan等人利用时空矩阵填充算法估算网络流量矩阵的缺失值,以及Lin等人利用时空张量填充算法提高交通数据张量的恢复精度。
为了提高网络流量缺失数据的恢复精度,本文提出了一种基于交替最小二乘法的时空张量填充算法。该算法不仅利用了张量分解及其低维表示,还充分考虑了网络流量数据的时空相关性,进一步提高了流量数据恢复的准确性。


网址:http://www.cnelc.com/text/32/200210/AD100909679_1.html
福州大学城论坛 - 声明 1、在发表言论时,请遵守当地法律法规。主题所有言论纯属个人意见,与本站立场无关。
2、本站所有主题由作者发表,作者享有帖子相关版权,其他单位或个人使用、转载或引用本文时必须征得作者同意并注明来源于福州大学城论坛
3、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意。
4、帖子不遵守当地法律法规、广告、人身攻击等情况时,福州大学城论坛管理人员有权不事先通知发贴者而删除本文。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|福州大学城论坛 ( 闽ICP备2022007610号-2 )|站点地图

GMT+8, 2025-6-21 12:24 , Processed in 0.298836 second(s), 7 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表