字节技术大牛跑步进入AIGC创业,聚焦视觉领域,搭建算法平台,还是多模态的那种...

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

3月最后一天,王长虎在龙湖集团的last day。

这位字节跳动前视觉技术负责人、AI Lab总监辞职挂印,火速启程下一站:AIGC创业,成立新公司爱诗科技。

他拉团队自起炉灶,要打造一个聚焦AIGC的视觉多模态算法平台 ,覆盖视觉相关的各种垂直应用场景。

2e220de3ef055c5fe097cc842c84f6d6.jpeg

当此大热的AIGC风口,王长虎已经是近期第N位勇闯创业潮的AI牛人。

聊起这事,王长虎说话间不自觉就提高了声音,语速也更快。他提到,创业是受时代和内心的双重感召,而且在风口和经历背书的双重加持下,目前看来,早期的融资推进颇为顺畅。

关于创业要干的事,他信心饱满:

技术难点?一定有,但也是好事,它就是我们不断形成竞争壁垒的机会,就是这时候需要我们去做的。

而且我们真的是打过硬仗的,之前在字节,那么难的事情都被我们扛过去了。所以在新的应用场景里边看到难点,蛮兴奋,看到了,就去解决它。

(“那么难的事情”,指对字节系短视频产品从0-1进行建设)

支持AIGC全生命周期的视觉多模态算法平台

在ChatGPT引爆的AIGC创业风潮后,王长虎的切入点不是底层大模型或To C应用层。

而是基于过去近20年的学术研究和技术应用能力,杀入中间层,打造视觉多模态算法平台,将焦点聚集在AIGC相关视觉领域的各个垂直应用场景。

并且在初始阶段,To B先落地践行。

所包含的多模态具体样式,根据视觉垂类领域应用的需求,初步设定为文字、图片、语音、视频,以及用户的个性化特征等,也是AIGC领域不断涌现新能力和产品的载体。

d15ea36908f53d09e8ea68a799f241e3.jpeg

根据王长虎的解释,利用AI,可以完成从UGC到AIGC的内容新升级。

“很多人关注AIGC,更多关注在内容生成方面。”从王长虎视角看过去,内容生成只是AIGC全生命周期的一个阶段,“其余阶段也有很多问题等待去解决。”

“很多问题”是哪些问题?

他结合此前经历,举例了两个UGC时代代表性场景来佐证他所说的内容生成之外,AIGC时代生产链的其他环节很大可能会遇到相同难题。

一个是在日活6亿,正负样本极不均衡的抖音或TikTok平台上,根据不同文化背景、具体要求等,必须要筛选出不合规的视频进行拦截,且需精准快速。

AIGC时代,这样确保安全的审核同样重要,且审核需求量更大。视觉多模态算法平台提供的算法,就包含了能够帮助使用方提高筛选和拦截效率的那种,并且很有可能如当初的字节一般,在王长虎提供的技术支持下代替成本高昂的人工审核,同时提升效率。

另一个场景是抄袭频发。AIGC时代,创作门槛降低,作品数量爆发,抄袭现象和版权纠纷大概率显著上升。

UGC时代已经验证过,长此以往,不仅打击原创者的创作意愿,对平台生态不利;而内容雷同或完全相同的视频持续推荐,用户体验也会大打折扣。

针对这个场景,王长虎要做的平台,就能为用户侧提供减少类似或雷同视频分发的AI算法

他还表示,这个聚焦AIGC的算法平台搭建过程中,很大可能会利用AIGC技术提升效率。

上述所有都是王长虎的现阶段思考,他才正式离职,刚刚开始筹备新公司事宜,新公司名为爱诗科技

粮草先行,目前组建了10余人的初始团队,也在招募核心技术和产品人才,为真正踩下出发的油门蓄力。

梳理他言语间透露出的规划,能嗅到关于创业项目的信息点:

搭建这样一个视觉多模态算法平台,能够支持AIGC新内容,帮用户解决内容生成、安全、版权、分发、商业化等几乎全生命周期的各项问题。

606b64ff4ec2a40ecf5faad3c648489a.png

新的AI浪潮到来,王长虎身处其间,感知到变化,并打算在新事业从善如流地用上旧经验,包括但不限于GPU集群能力、服务调度能力、自动化模型训练能力,推断能力等。

经验不会凭空出现,既有功力的来源,主要可以定位回他在字节跳动任职期间

2017年,王长虎加入字节跳动。那时候人们对字节的感知,通过今日头条远大于通过抖音。王长虎加入之初,就是在字节内部创业般,从0到1深度参与建设短视频类产品

此次To B和To C层面可能遭遇的各种问题,如降本增效、版权厘清、用户体验等,王长虎都在那时以技术或实现或改善或解决。

再一次“从0到1建设技术平台和产品”,王长虎表示,上述经验都可以一以贯之应用在此次AIGC创业。

09d55f0fb5f46487d87e07d4fd2ab421.gif

与AIGC缘起20年前的本科研究

新公司还在襁褓,王长虎不愿过多详谈,他更愿意谈论的是此前的技术经验,当然也包括“技术底色上滋养出的AI情结”。

这要从王长虎还是中国科学技术大学6系(电子工程与信息科学系)大四学生时聊起。

那是2004年,他做了人生首个研究,即根据一张或多张人脸图片,生成该人脸的3D模型。此研究后来发表到国际会议上。

他不无兴奋地说:

回看20年前,我此生做的第一个研究,就和AIGC有关。

同年,王长虎进入MSRA实习,中科大博士毕业后转为正式员工,直到2017年离开。

13年间的工作内容也与AIGC有千丝万缕的联系,他所在团队研究的“神笔马良”草图搜索技术,可以基于海量图像数据建立搜索引擎。

当然,那时候生成式技术没有成熟,业界对大规模数据的训练和处理经验也远不如今日丰富,所以整个过程是在海量数据库中寻找和草图最匹配的那一张。

回忆此处,王长虎的语气中多少带了些感慨,因为现在的范式也是基于海量数据去训练一个模型,然后根据用户输入的文字或图像信息,生成一张最匹配prompt的图片。

965707a4cc26fe2311eda5aa05fb805b.png草图搜索技术示例

都说十年磨一剑,但在微软实习和工作13年后,王长虎毅然奔赴字节跳动,选择的还是当时并非招牌的视频类产品。

为什么去字节?毕竟王长虎自己也承认,在微软可以做世界上最顶尖前沿的科学研究。

但在微软,科研项目应用到公司产品需要的周期特别长。

他举例分享,自己二零零几年做的工作,若干年后才真正应用在必应搜索引擎,新技术很难在第一时间影响用户。

但这一点在字节可以实现,再加上加入字节时,恰巧是短视频类产品筚路蓝缕打根基的时候——这也是字节AI Lab与其他大厂AI Lab的区别所在,即并非在产品成熟后才建立AI部门,也因此,王长虎有机会在产品0到1发展历程中扮演核心角色。

公开资料显示,字节跳动人工智能实验室(AI Lab)的成立使命,就是推动机器智能的极限,致力于将AI理论研究快速应用于产品部署。

现在翻看王长虎公开简历,字节任职期间,留下的足迹如下:

  • 完整参与了抖音和TikTok等短视频类产品从0到1的建设和发展;

  • 建设了视觉技术和业务中台,带领团队将相关技术广泛应用到字节跳动全线产品中;

  • 为集团各产品提供AI技术支撑和业务解决方案,覆盖了视觉相关产品内容生产与消费的全流程

期间,他搭建的数百人团队,不仅有技术人员,还包含了产品同学。如果把微软看成王长虎的技术练兵地,王长虎就把字节和龙湖的经历,看成是对他技术和产品两方面认知的锻炼。

3cbce1cbe7dd32f46bf560548ec0ff16.png王长虎

和从字节去龙湖的原因一样,选择加入AI 2.0创业大潮,他的理由是“跳出舒适区”

当然,这一次的催动因素更复杂,譬如ChatGPT和Stable Diffusion的惊艳表现,以及自己从DL热潮走来,对又一次“翻天覆地变化”的不容错过。

他说,这个机会更大,不像元宇宙、区块链是被一部分人看到,AIGC是多数普通人能看到和感受到的。言语间,王长虎又传递出自己对“新技术快速影响用户”的看重

如今离职创业,他又有机会身体力行地这样做了。

参考链接:
[1]《草图搜索的魅力与挑战》https://blog.sina.com.cn/s/blog_4caedc7a0102en29.html

— 联系作者 —

1435f4aa40b229c4fbba68a7392dcd0f.png

「人工智能」、「智能汽车」微信社群邀你加入!

欢迎关注人工智能、智能汽车的小伙伴们加入交流群,与AI从业者交流、切磋,不错过最新行业发展&技术进展。

PS. 加好友请务必备注您的姓名-公司-职位噢 ~

15b59bb8dec88a788bccaacf3c4715ae.jpeg

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25447.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华人高管加入OpenAI;富士通发布AI平台;成都为鼓励AI产业发展提出19项资金扶持措施丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 三六零参与编写中国大模型应用标准 6月1日,从公司处获悉,三六零将参与编写中国大模型应用标准,公司日前被授予《大规模预训练模型技术和应用评估方法第四部分:模型…

阿里巴巴集团告别 CTO?

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 近日,据雪豹财经社、界面新闻等多个媒体报道,阿里内部开始了新一轮的组织架构调整,其中原先 CTO 线中的业务中台、供应链中台等核心团队并入 CDC(国内数字…

37岁程序员失业后摆摊卖饼,月入上万!网友:“再也不用解决 Bug 了”

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 失业不可怕,关键是思路打开重新赚钱养家! 近日,有网友发现,37 岁的程序员杨先生在失业之后,选择靠做小摊美食鲜肉饼重启他的职…

基于JAVA解决淘宝爬虫限制

不仅仅限于java 前言验证码识别工具分析编码 数据演示后记 前言 以前做过淘客开发,那时候高佣api很少,高佣的办法就是查询商品模拟转链为高佣,但是后来淘宝慢慢禁止了爬虫一直弹验证码,后来我就利用验证码识别成功扛过那段日子&a…

爬虫基本原理介绍、实现以及问题解决

文章目录 一、爬虫的意义1.前言2.爬虫能做什么3.爬虫有什么意义 二、爬虫的实现1.爬虫的基础原理2.api的获取3.爬虫实现 三、反爬解决方案1.反爬的实现方式2.反爬的解决方法3.反爬的实现代码4.IPIDEA还能做什么 四、总结 一、爬虫的意义 1.前言 最近拉开了毕业季的序幕&#…

图文并茂|AIGC的浪潮下,文本生成发展得怎么样了?

来自:机器之心和澜舟科技 1 月 12 日,在机器之心 AI 科技年会 AIGC 技术应用论坛上,澜舟科技创始人兼 CEO、中国计算机学会 CCF 副理事长、创新工场首席科学家周明发表了主题演讲《文本生成研究进展》。 进NLP群—>加入NLP交流群 以下为演…

prophet

用好小模型!这里提出了名为 Prophet 的框架,通过在 LLM 上游引入一个可学习的、任务相关的视觉问答小模型,来更好地激发大模型的潜力。 用小模型启发大语言模型解决外部知识图像问答 大规模语言模型(Large Language Model&#x…

通过LLM构建聊天机器人必备技巧

聊天机器人在AI领域并不稀奇,尤其是ChatGPT问世之后,很多人都把它当成一个可以随时对话随意提问的聊天机器人。而在实际应用领域,聊天机器人的场景也愈加丰富多样。 比如很多人熟知的客服聊天机器人,常用在电商领域,能…

基于PHP的招聘网站

摘要 在Internet高速发展的今天,我们生活的各个领域都涉及到计算机的应用,其中包括在线招聘的网络应用,在外国在线招聘已经是很普遍的方式,不过国内的在线招聘可能还处于起步阶段。招聘网站具有招聘信息功能的双向选择&#xff0c…

丘仕达:SEO资料站管理团队成员招募

管理团队终于要成立了,我以为我会很兴奋或激动,奇怪的是我没有. 一直都想组团队,但我自己走了很多弯路,一直都在问自己:你能给团队成员什么利益?你能保证团队成员之间利益分配合理不冲突吗? 答案是不能.所以我一直在犹豫,给了自己一个理由:多观察下,给多点时间彼此来磨合.磨到…

如何招聘一个外贸SEO推广人员以及如何做后期的KPI考核

随着国内SEO行业的日渐成熟,越来越多的外贸公司,开始招聘专门的SEO人员,如果你去招聘网站上搜“外贸SEO”,会发现很多这样的公司。 总的来说,SEO的薪资水平还是不低的,深圳外贸行业SEO人员的平均月薪在8K以…

AI_News周刊:第三期

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 2023.02.20—2023.02.25 News 1.OpenAI 现在正在帮助可口可乐改善其营销和运营 2023 年 2 月 21 日——贝恩公司今天宣布与 OpenAI 建立全球服务联盟,OpenAI 是人工智能系统 ChatGPT、DA…

人工智能轨道交通行业周刊-第27期(2022.12.12-12.25)

本期关键词:虚拟中台、智轨、数字员工客服、钢轨光带异常、小目标检测 1 整理涉及公众号名单 1.1 行业类 RT轨道交通中关村轨道交通产业服务平台人民铁道世界轨道交通资讯网铁路信号技术交流北京铁路轨道交通网上榜铁路视点ITS World轨道交通联盟VSTR铁路与城市轨…

AI_Papers周刊:第五期

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 2023.03.06—2023.03.12 Top Papers Subjects: cs.CL 1.Larger language models do in-context learning differently 标题:更大的语言模型以不同的方式进行上下文学习 作者&#xff…

又编解码错误?一怒之下我把编解码的问题连根拔起!!!

文章目录 寻找同道问题解决专栏有哪些常用编码集?pycharm一劳永逸大法 寻找同道 运行代码的时候,最烦的就是代码逻辑都好好的,然后出现了编解码错误的报错。 我就纳闷儿了,我就做个测试,你错误就错误呗,你…

知乎高赞:Java9的模块化技术在应用上有什么价值?

点击关注公众号,利用碎片时间学习 来源:zhihu.com/question/264956573/ answer/1840974105 最近就正好在倒腾模块化,说说我们的应用场景 就是用java来写steam上的游戏,那缺省的jdk,它提供了语言常见的功能 但是 jdk并不…

知乎的彩蛋

在这篇文章中《Python一个有趣的彩蛋命令行执行python -c "import this"或者在python解释器中执行import this,会打印出Python之禅,另外介绍了个Chrome的彩蛋,在地址栏输入chrome://dino/,就可以打开一个小恐龙跑酷的黑…

设计模式看了又忘,忘了又看?

设计模式收藏这篇就够了 耗时了 5 个月,终于把设计模式一整个系列写完。其实设计模式这一系列文章网上已经有很多非常好、非常优秀的文章,为什么要写呢? 一方面是为了学得更扎实,印象中设计模式学习了 2 遍,记得牢的基…

响铃:IP跨界她经济,同道能讲好“单身婚纱”的故事吗?

文|曾响铃 来源|科技向令说(xiangling0815) 国泰君安证券报告显示,女性消费对经济增长的贡献率接近70%,到2019年中国内地女性经济市场规模近将接近4.5万亿元,而家庭消费中,近75%由女性决策。 由此引发的…

“因为内存泄漏,我的 M1 MacBook Pro 瘫痪了”

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 上个月,苹果在宣布“王炸候场中”后,19 号发布了 AirPods 3、HomePod mini 等新品,而这场发布会真正的主角当属新款 MacBook Pro:强悍的 M1 Pro/M1 Max…