从技术面来看,向量数据库底座自然而然向外延伸的产品包含:
1)向量提取,从非结构化数据中提取向量,这是向量数据库上游的工作,十分重要;
2)模型选择,选择正确的模型,能够更精准、更高质量地提取向量;
3)映射管理,即管理数据的本体和数据的语义层之间的映射,在非结构化数据量庞大的情况下,有效维护前述映射会变得很复杂;
4)映射关系的增删改查,数据不是一成不变的,如何动态维持映射关系极富挑战性;
5)数据与模型和应用的交互,有了向量数据库后,语义的表达最终要和机器、算法和模型交互,其中向量数据库到各种模型之间的交互、AI 应用程序之间的交互和整合极为复杂;
6)数据对不同模型的整合交互,如何使不同领域大模型(视觉、推荐系统、自动驾驶、生物等领域)算法实现更好的整合和无缝的语义层交互,也是非结构化数据平台要处理的问题。