pip install matplotlib scikit-learn sentence-transformers
数据分类别可视化
t-SNE算法将高维数据映射到2D空间后的坐标。
t-SNE是一种用于数据降维和可视化的技术,它的作用是将原本在高维空间中的复杂数据压缩到低维空间,同时尽可能保留数据点之间的距离关系。
举例:
https://arxiv.org/pdf/2310.05492
这张图展示了使用t-SNE算法对高维数据进行降维后的2D散点图。不同颜色的点代表不同类别的数据,展示了t-SNE如何在降维过程中尽可能保持数据点之间的距离关系。可以看到,部分数据点聚集得较为紧密,表示它们在高维空间中有相似的特征,而其他点分布较为分散。
import json