AI博士人手10篇顶会，遭质疑。。。

B站：啥都会一点的研究生
公众号：啥都会一点的研究生

AI科技圈又发生了啥新鲜事？

“稚晖君”灵犀X1全球开源，推动人形机器人技术共享

智元机器人宣布其人形机器人灵犀X1正式面向全球开源，提供了超过1.2GB的软硬件全套图纸和代码。开源内容涵盖了详细的结构图纸、硬件框图、物料清单、装机说明以及软件算法等，旨在为科技爱好者和科创公司提供一站式技术资源，降低研发成本。灵犀X1以其高自由度和模块化设计，搭配自研关节电机和OmniPicker夹爪，展现了其在多场景应用中的潜力。这一开源举措不仅促进了技术共享，也为机器人领域的创新和发展提供了新动力

https://www.bilibili.com/opus/991734208102662148

美国AI博士生高产论文背后：工作狂文化与资源差异

美国AI领域的博士生以高产论文著称，背后是他们每天工作超过10小时、7天无休的高强度工作文化，以及顶尖机构丰富的GPU资源和知名机构背书的优势。这种工作模式和资源优势让美国博士生在顶会如CVPR、ICML、ICLR、NeurIPS上发表论文的数量远超其他国家，引发了欧洲同行的质疑和讨论。同时，这种现象也被认为是幸存者偏差，因为并非所有美国博士生都能达到这样的高产出

https://36kr.com/p/3002086122141833

Claude AI 上线新工具：分析、可视化 CSV 文件中的数据

Anthropic 在更新 Claude 3.5 Sonnet 并推出 Claude 3.5 Haiku 后，新增了一款能够编写和运行 JavaScript 代码的分析工具，旨在处理数据、进行分析并生成实时洞察。这款工具将作为 Claude.ai 的内置功能，类似于 ChatGPT 的代码解释器，能够帮助用户清理、探索和分析数据，直至达到预期结果，并与 Artifacts 一起创建互动数据可视化，目前处于功能预览阶段

https://www.ithome.com/0/805/104.htm

OpenAI CEO 否认“Orion”模型发布计划

OpenAI首席执行官近日在社交媒体上澄清，有关公司计划推出下一代模型“Orion”的报道是“假消息失控了”。此前有消息称，该模型将在今年12月推出，并且性能将比GPT-4强大100多倍。阿尔特曼的回应平息了外界对这一传闻的猜测

https://tech.ifeng.com/c/8dyLAk8xJos

北京发布教育领域人工智能应用指南，推动AI技术在教育中的实践应用

北京市教育行政主管部门近日发布了首份《北京市教育领域人工智能应用指南》，明确了人工智能在六大教育领域的29个典型场景的应用规范。该指南旨在指导学校和师生安全、有序地开展人工智能技术的应用实践，提升教育质量。到2027年，北京计划实现教育领域人工智能的规模化、系统化、常态化应用

https://www.ithome.com/0/805/526.htm

MiniMax即将发布实时语音对话API，挑战GPT-4o

AI独角兽MiniMax计划在11月推出一款新的Realtime API服务，旨在提升端到端实时多模态处理能力，提供更低延时、更自然的实时语音对话体验。这款产品将直接对标OpenAI的GPT-4o，后者以其快速响应和多模态能力著称。据艾瑞咨询预测，到2026年，对话式AI市场规模将达到108亿元，带动规模超385亿元，五年复合年均增长率32.5%。MiniMax的这一举措，无疑将为快速增长的对话式AI市场注入新的活力

https://mp.weixin.qq.com/s/-Kzn8S6ZgU_4ptXBrtCthw

科大讯飞发布讯飞星火4.0 Turbo，七大能力超越GPT-4 Turbo

科大讯飞在2024全球1024开发者节上推出了讯飞星火4.0 Turbo，该模型在七大能力上全面超越了GPT-4 Turbo，尤其在数学和代码能力上表现突出。星火4.0 Turbo预计年底将实现类似GPT-1的高难度数学解题能力，并通过算法验证了超长思维链、树搜索和自我反思评价等能力。此外，新推出的星火代码7B版本在端侧本地运行，提供业界最优的代码生成和补全效果

https://www.ithome.com/0/804/770.htm

商汤科技发布新战略，目标2026年实现盈利

商汤科技在成立十周年之际，CEO徐立宣布了"大装置-大模型-应用"的新战略，旨在通过优化算力资源使用效率，服务客户。商汤计划围绕这一战略构建更高效的组织架构，以适应AI 2.0时代的需求。徐立表示，商汤有望在2026年实现盈利，这得益于GPU算力资源使用效率的不断提升。2024年上半年，商汤总收入达到17.4亿元，同比增长21%，其中生成式AI业务收入10.51亿元，同比增长256%，占总收入比例达60%

https://www.tmtpost.com/7295631.html

达摩院开源CoI-Agent：AI科研助手助力科研创新

阿里巴巴达摩院开源了一款名为CoI-Agent的AI工具，它能够通过输入论文主题迅速生成相关的科研idea，包括关键词、研究问题和研究方法。这款工具不仅适用于自然科学，还可用于社会科学和工程技术等多个领域，旨在提高科研人员的工作效率

https://github.com/DAMO-NLP-SG/CoI-Agent

14岁少年沉迷AI聊天机器人后自鲨，母亲起诉Character.AI和谷歌

因14岁儿子沉迷于Character.AI的聊天机器人后自鲨，其母亲对Character.AI及其创始人、谷歌提起诉讼。她指控这些公司产品设计失职，误导消费者，尤其是儿童。Character.AI的聊天机器人被指过于拟人化，提供未经许可的心理治疗，可能对少年心理状态产生影响。公司已宣布新安全措施，包括修改未成年人模型、提升违规内容检测能力、加入免责声明等，以减少心理健康风险

https://www.huxiu.com/article/3612942.html

24 年生成式 AI 增长17%，但数据质量堪忧

尽管生成式AI在2024年实现了17%的增长，但企业在数据管理上遇到了难题。AI项目的投资回报率下降，成功部署的AI项目比例减少了8.1%，而那些能够带来可观回报的项目数量也下降了9.4%。数据准确性下降了近9%，86%的企业每季度都需要更新模型，以应对数据准确性和多样性的更高要求。企业开始寻求外部数据提供商的帮助，并强调人机协作在提升AI模型性能中的重要性

https://www.aibase.com/zh/news/12661

北大研发多模态框架FakeShield，提升图像伪造检测与定位能力

北京大学与华南理工大学的研究团队推出了新型多模态框架FakeShield，该框架能够检测图像伪造、定位篡改区域，并提供基于像素和图像语义错误的合理解释。FakeShield通过结合多模态大语言模型的视觉和语言理解能力，不仅提高了检测的准确性和解释性，还增强了模型的适应性和实用性。在实验中，FakeShield在Photoshop、DeepFake和AIGC编辑等数据集上的检测准确率和F1分数均显著优于其他方法，展现了其在图像篡改检测领域的强大潜力