文章目录
- 简介
- 图片理解
- 长文档解析
简介
kimi.ai是国内初创AI公司月之暗面推出的一款AI助手,终于不再是四字成语拼凑出来的了。这是一个非常存粹的文本分析和对话工具,没有那些东拼西凑花里胡哨的AIGC功能,实测表明,这种聚焦是对的,一番操作下来,Kimi无论在文字对话、联网搜索、以及图像和长文本分析上,都在我用过的所有国内AI助手中,有着独一档的使用体验。
Kimi的搜索框中有三个图标
- 🌐 联网开关,开启之后可以获取实时的互联网信息
- 📤︎ 上传文档,可以上传 50 × 100 M 50\times100M 50×100M的文件,用于分析。支持pdf, doc, xlsx, ppt, txt, 图片等格式。
- 最后一个是发送按钮,回车也可以发送文本框中的内容
kimi还提供了App可供下载,手机可用。
图片理解
下面测试一下图像模式,在输入下面这张图像后,Kimi.ai给出了后面的回答
这份文件列出了一系列发型的名称,具体如下:
- 黑长直 - 指的是一种自然的黑色长发,通常直顺,没有卷曲。
- 油头 - 又称为背头,是一种将头发向后梳理,使头发看起来光滑有光泽的发型。
- 卷发 - 泛指头发呈现出自然的卷状,可以是大卷、小卷,或者波浪状的发型。
- 丸子头 - 一种将头发扎成圆形或半圆形的发型,通常位于头顶或后脑勺。
- 地中海 - 通常用来形容男性头顶部分脱发,形成类似地中海沿岸的发型。
- 复古卷 - 指的是模仿过去某个时代的流行卷发样式,给人一种复古的感觉。
- 锡纸烫 - 一种利用锡纸将头发部分或全部卷起,通过热处理使头发形成卷曲的烫发方式。
- 飞机头 - 一种两侧头发剪短,顶部留长的发型,因形似飞机而得名。
- 寸头 - 一种非常短的发型,通常头发长度不超过一寸,给人一种干练的感觉。
这些发型名称涵盖了不同的风格和造型,从传统的直发、卷发到更具特色的飞机头和寸头等。
接下来看看另外两个国内知名竞品的回答
# 回答一
该图片是一个由九张照片组成的网格,展示了一个人从年轻到年老的变化过程。每张照片都标注了一个特定的年龄阶段,从’黑长直’的年轻人开始,随着年龄的增长,头发逐渐变少并最终变成一个光头的老年人。# 回答二
以下是我对图片的理解:
图中是一个表情包,包含9张不同发型的头部照片,分别用“飞机头”、“寸头”等字幕标注。
可以参考下面的提问方式:请根据图片内容,写一首李白风格的七言绝句。
根据图片信息,写一篇100字左右的朋友圈配文。
根据图片描述的信息写一篇小红书文案。
我相信,只要提问方式得当,后两者也有足够的能力回答出与kimi相同的答案,反之亦然。但是从侧重点出发,kimi的第一反应,显然是更加符合我们的目标的。
长文档解析
kimi的强大之处在于,并不一定需要上传pdf文件,而只要给他一个网址,他就能自行分析文档内容了,例如下面的问题
https://arxiv.org/abs/1612.03144 我们可以从这篇paper中学到哪些关键的新想法和新知识?
kimi的回答如下。而且随后,可以继续向他提问有关这篇文献中的内容,非常丝滑。
这篇论文《Feature Pyramid Networks for Object Detection》介绍了一种名为特征金字塔网络(FPN)的新架构,它在目标检测领域取得了显著的进展。以下是从这篇论文中学到的关键新想法和新知识:
- 特征金字塔的概念:特征金字塔是计算机视觉中用于检测不同尺度对象的基本组件。FPN利用深度卷积网络(ConvNets)的固有多尺度、金字塔层次结构来构建特征金字塔,而额外的计算和内存开销很小。
- 自顶向下的架构与横向连接:FPN开发了一种自顶向下的架构,通过横向连接在所有尺度上构建高级语义特征图。这种架构能够在多个应用中作为通用特征提取器显著提高性能。
- 显著的性能提升:使用FPN的Faster R-CNN系统在COCO检测基准测试中取得了最先进的单模型结果,超越了所有现有的单模型参赛作品,包括COCO 2016挑战赛的获胜者。
- 实用性和准确性:FPN能够在GPU上以6 FPS的速度运行,因此它是一个实用且准确的多尺度目标检测解决方案。
- 代码公开:论文承诺将公开代码,这将有助于社区进一步研究和应用FPN。
- 相关工作的讨论:论文详细讨论了手工设计的特征和早期神经网络,以及深度ConvNet目标检测器的发展历程,提供了对特征金字塔在目标检测中重要性的深入理解。
- 特征金字塔网络的构建:论文详细介绍了如何通过自底向上的路径、自顶向下的路径和横向连接来构建FPN,以及如何通过简单的设计实现强大的性能。
- 应用:FPN不仅适用于目标检测,还可以扩展到实例分割提议的生成,展示了其作为一种通用特征提取器的灵活性。
- 实验结果:论文提供了在COCO数据集上的详细实验结果,包括区域提议网络(RPN)和Fast R-CNN在固定提议集上的性能,以及与COCO竞赛获胜者的比较。
- 运行时间:尽管FPN引入了额外的层,但由于其轻量级的头部设计,整体系统比ResNet基础上的Faster R-CNN更快。
这些新想法和新知识对于目标检测和相关领域的研究人员来说是非常宝贵的,因为它们提供了一种新的视角和工具来处理多尺度目标检测问题。