拓扑数据分析(Topological Data Analysis, TDA)是拓扑学和数据科学相结合得到的技术,按定义,TDA是以持续同调(persistent homology)为基础,对数据的拓扑学特征(topological features)进行分析的方法。 TDA的一般性目的是从高维数据中提取有效信息,按机器学习观点属于非监督学习和表征学习。其分析过程不会引起信息的损失,且被认为对缺失和噪声样本稳定。由于TDA的分析对象是独立于度量(metric)的拓扑学特征(按一般用语可表述为“抽象的形状”、“点与点之间的关系”),因此TDA能够整合并协同分析不同度量(坐标)下的数据集。 TDA被应用于计算几何学问题,例如3D扫描器输出的点云(point cloud)数据的分析、重建和可视化。在生物信息学和医学领域,例如癌症基因样本的研究中也有应用。