- B站:啥都会一点的研究生
- 公众号:啥都会一点的研究生
AI科技圈又发生了啥新鲜事?
“稚晖君”灵犀X1全球开源,推动人形机器人技术共享
智元机器人宣布其人形机器人灵犀X1正式面向全球开源,提供了超过1.2GB的软硬件全套图纸和代码。开源内容涵盖了详细的结构图纸、硬件框图、物料清单、装机说明以及软件算法等,旨在为科技爱好者和科创公司提供一站式技术资源,降低研发成本。灵犀X1以其高自由度和模块化设计,搭配自研关节电机和OmniPicker夹爪,展现了其在多场景应用中的潜力。这一开源举措不仅促进了技术共享,也为机器人领域的创新和发展提供了新动力
https://www.bilibili.com/opus/991734208102662148
美国AI博士生高产论文背后:工作狂文化与资源差异
美国AI领域的博士生以高产论文著称,背后是他们每天工作超过10小时、7天无休的高强度工作文化,以及顶尖机构丰富的GPU资源和知名机构背书的优势。这种工作模式和资源优势让美国博士生在顶会如CVPR、ICML、ICLR、NeurIPS上发表论文的数量远超其他国家,引发了欧洲同行的质疑和讨论。同时,这种现象也被认为是幸存者偏差,因为并非所有美国博士生都能达到这样的高产出
https://36kr.com/p/3002086122141833
Claude AI 上线新工具:分析、可视化 CSV 文件中的数据
Anthropic 在更新 Claude 3.5 Sonnet 并推出 Claude 3.5 Haiku 后,新增了一款能够编写和运行 JavaScript 代码的分析工具,旨在处理数据、进行分析并生成实时洞察。这款工具将作为 Claude.ai 的内置功能,类似于 ChatGPT 的代码解释器,能够帮助用户清理、探索和分析数据,直至达到预期结果,并与 Artifacts 一起创建互动数据可视化,目前处于功能预览阶段
https://www.ithome.com/0/805/104.htm
OpenAI CEO 否认“Orion”模型发布计划
OpenAI首席执行官近日在社交媒体上澄清,有关公司计划推出下一代模型“Orion”的报道是“假消息失控了”。此前有消息称,该模型将在今年12月推出,并且性能将比GPT-4强大100多倍。阿尔特曼的回应平息了外界对这一传闻的猜测
https://tech.ifeng.com/c/8dyLAk8xJos
北京发布教育领域人工智能应用指南,推动AI技术在教育中的实践应用
北京市教育行政主管部门近日发布了首份《北京市教育领域人工智能应用指南》,明确了人工智能在六大教育领域的29个典型场景的应用规范。该指南旨在指导学校和师生安全、有序地开展人工智能技术的应用实践,提升教育质量。到2027年,北京计划实现教育领域人工智能的规模化、系统化、常态化应用
https://www.ithome.com/0/805/526.htm
MiniMax即将发布实时语音对话API,挑战GPT-4o
AI独角兽MiniMax计划在11月推出一款新的Realtime API服务,旨在提升端到端实时多模态处理能力,提供更低延时、更自然的实时语音对话体验。这款产品将直接对标OpenAI的GPT-4o,后者以其快速响应和多模态能力著称。据艾瑞咨询预测,到2026年,对话式AI市场规模将达到108亿元,带动规模超385亿元,五年复合年均增长率32.5%。MiniMax的这一举措,无疑将为快速增长的对话式AI市场注入新的活力
https://mp.weixin.qq.com/s/-Kzn8S6ZgU_4ptXBrtCthw
科大讯飞发布讯飞星火4.0 Turbo,七大能力超越GPT-4 Turbo
科大讯飞在2024全球1024开发者节上推出了讯飞星火4.0 Turbo,该模型在七大能力上全面超越了GPT-4 Turbo,尤其在数学和代码能力上表现突出。星火4.0 Turbo预计年底将实现类似GPT-1的高难度数学解题能力,并通过算法验证了超长思维链、树搜索和自我反思评价等能力。此外,新推出的星火代码7B版本在端侧本地运行,提供业界最优的代码生成和补全效果
https://www.ithome.com/0/804/770.htm
商汤科技发布新战略,目标2026年实现盈利
商汤科技在成立十周年之际,CEO徐立宣布了"大装置-大模型-应用"的新战略,旨在通过优化算力资源使用效率,服务客户。商汤计划围绕这一战略构建更高效的组织架构,以适应AI 2.0时代的需求。徐立表示,商汤有望在2026年实现盈利,这得益于GPU算力资源使用效率的不断提升。2024年上半年,商汤总收入达到17.4亿元,同比增长21%,其中生成式AI业务收入10.51亿元,同比增长256%,占总收入比例达60%
https://www.tmtpost.com/7295631.html
达摩院开源CoI-Agent:AI科研助手助力科研创新
阿里巴巴达摩院开源了一款名为CoI-Agent的AI工具,它能够通过输入论文主题迅速生成相关的科研idea,包括关键词、研究问题和研究方法。这款工具不仅适用于自然科学,还可用于社会科学和工程技术等多个领域,旨在提高科研人员的工作效率
https://github.com/DAMO-NLP-SG/CoI-Agent
14岁少年沉迷AI聊天机器人后自鲨,母亲起诉Character.AI和谷歌
因14岁儿子沉迷于Character.AI的聊天机器人后自鲨,其母亲对Character.AI及其创始人、谷歌提起诉讼。她指控这些公司产品设计失职,误导消费者,尤其是儿童。Character.AI的聊天机器人被指过于拟人化,提供未经许可的心理治疗,可能对少年心理状态产生影响。公司已宣布新安全措施,包括修改未成年人模型、提升违规内容检测能力、加入免责声明等,以减少心理健康风险
https://www.huxiu.com/article/3612942.html
24 年生成式 AI 增长17%,但数据质量堪忧
尽管生成式AI在2024年实现了17%的增长,但企业在数据管理上遇到了难题。AI项目的投资回报率下降,成功部署的AI项目比例减少了8.1%,而那些能够带来可观回报的项目数量也下降了9.4%。数据准确性下降了近9%,86%的企业每季度都需要更新模型,以应对数据准确性和多样性的更高要求。企业开始寻求外部数据提供商的帮助,并强调人机协作在提升AI模型性能中的重要性
https://www.aibase.com/zh/news/12661
北大研发多模态框架FakeShield,提升图像伪造检测与定位能力
北京大学与华南理工大学的研究团队推出了新型多模态框架FakeShield,该框架能够检测图像伪造、定位篡改区域,并提供基于像素和图像语义错误的合理解释。FakeShield通过结合多模态大语言模型的视觉和语言理解能力,不仅提高了检测的准确性和解释性,还增强了模型的适应性和实用性。在实验中,FakeShield在Photoshop、DeepFake和AIGC编辑等数据集上的检测准确率和F1分数均显著优于其他方法,展现了其在图像篡改检测领域的强大潜力
https://www.ithome.com/0/805/001.htm