随着大数据产业的不断发展,矩阵已无法满足人们存储数据的需求.大数据的特点不仅体现在数据规模上,也体现在数据的多标签性和强结构性上,利用张量理论存储、分析数据则可以很好地还原这些特性.事实上,张量在信号处理、数据挖掘、神经科学、计算机视觉、量子力学等领域中已经开始扮演着重要角色.张量补全、张量回归、张量分类、张量主成分分析等解决数据分析问题的重要模型也得到了广泛关注.而此类模型的求解通常需借助张量低秩逼近算法,因此对张量低秩逼近相关概念及算法进行讨论和研究是非常必要的.
现有的张量低秩逼近问题一般来源于经典的张量CP分解和Tucker分解,还有部分低秩逼近问题来源于t-SVD、张量列式分解等分解形式.但是,这些张量分解方法并不是时刻都能满足数据分析需求.例如,多模态数据分析问题和多体量子态可分性分析问题所涉及的张量就具有更特殊的结构,现有的分解方式则会破坏这种结构.由此可见,综合分析张量在不同角度下所表现出来的特征的异同,才能更准确地分析张量数据.本报告的主旨就是对该问题进行探讨和研究.
首先,本报告将介绍一种张量维度的分组方式.张量维度的不同分组对应着张量的不同研究角度,通过变化分组可以实现张量分析角度的变化.其次,本报告将基于张量维度的不同分组及张量与多重线性映射的关系介绍一种新的张量分解定义—张量$\alpha$-CP分解,并提出相应的低$\alpha$-秩逼近问题及求解算法.该定义以经典的CP分解为特例,将其向量分解因子推广为低阶张量,为张量分解增添了更多可能性.最后,本报告还将分享将$\alpha$-秩和低$\alpha$-秩逼近应用于张量补全、张量压缩问题时所产生的效果,并探讨实际应用中最佳分组的选择方法.数值实验表明,本报告中所提出的张量$\alpha$-CP分解和张量$\alpha$-秩的概念对研究带特定结构的张量具有着重要意义.