有哪些值得关注的AIGC细分方向?

2422d7a70cbaf9c9ccffe61fc84c1f5e.png

(以下内容,来自咱们社群“AI产品经理大本营” 1月12日的团员内部讨论;本文不求大而全,但会有一些大家“没听说过的一手信息input”‍‍‍‍

【参与团员】

A:某司 负责 AIGC

B:某司 负责 医疗AI产品

C:头部大厂 负责 生成式虚拟人产品

D:AI stealth startup 负责 产品

E:某司 负责 AI创作者服务

F:转型AIGC产品中

G:某独角兽AI厂 负责 大模型商业化

H:某AI top厂 负责 数字人产品

I:头部大厂 负责 AI2B商业化

hanniman:AI产品经理大本营创建者(团长)

主要结论

1、“AIGC+少儿教育”是不错方向,例如少儿绘画、少儿编程AIGC绘本、AI讲故事等,附上了Osmo MOnsters4个相关产品信息链接。不过教育场景,生成可控性需要严谨可控。

2、文生图方向的Genenral认知:1)大B难做(定制化需求多、耗费人力)。2)对小B finetune as a service(finetune本身没什么技术含量,但在细分领域的衍生需求引起的模型和工程化积累还是有意义的)。3)对专业创作者/设计师的创业工具定位,有潜力但距离能准确纳入工作流,还有较大距离。4)定制设计,主要卡在供应链上,定制化和生产成本天然有矛盾;不过出现了AI纹身贴AI定制美甲等轻量产品。5)对2C用户,卡在商业化潜力上,需要有超越工具付费/内容消费的新商业模式。6)对中小广告主,“处理图片侵权”是个价值点。7)对游戏,AIGC生成asset本身不够的,需要更好融入游戏体验中,或者创造新游戏形式。

3、“AIGC+医疗”方向,比如手术效果模拟,产品视角看有机会,不过其实有团员在前公司已做过MVP,但效果不够好(数据问题、用户接受度不高、算法还不能实现定向编辑)。

4、AIGC+生产力:让非专业的人也能达到60分水平、3个工具产品案例,and 有博主已经在推相关的AIGC优化工作流的经验了。

5、大厂基于内部业务衍生出AIGC 2B服务,比如很多互娱/广告客户,上来就是“我要抖音同款”。另外,计划通过标品去收更多定制化需求。

6、Gan和diffusion的区别

讨论全文

讨论点1:AIGC+少儿教育(发起人:团员A

团员A:非常看好“AIGC+少儿教育”如没有足够的行业积累建议避开智能设计、电商、办公创作等拥挤赛道。

hanniman:感觉这篇主要是讲,要选有市场机会、细分、竞争对手少的方向,所以少儿教育是可选方向,这样?然后具体的,AIGC 在少儿教育方向,具体可以怎么做呢?

团员D:国外有一些给儿童的story telling工具;国内美术宝,我发现在招AIGC算法~

团员A:是的,少儿绘画、少儿编程等方向,aigc都可以做

团员E:之前我们有一些达人在用AIGC做绘本(点赞:hanniman)

会后补充: 百度曾PR过相关的话题,AIGC绘本出版https://mp.weixin.qq.com/s/5Oj0JtRjve2Ydu_ZJZAOVg

团员D:我其实也看好这个方向,国外以前很火的Osmo MOnsters 很适合和AI结合

会后补充 AWS关于Osmo MOnsters的介绍    https://mp.weixin.qq.com/s/Jk4L47Msr1tIlOy-yCCOvQ

团员A:儿童/孩子用语音输入,即可生成几幅创意画作,然后由老师在旁边引导。我们调研到很多相关的线上应用和线下培训机构渠道商 (点赞:阿沛、hanniman)

团员D:wordtoworld.iohttp://storiesforkids.ai/ 上面这两个产品都是AI辅助讲故事的~第一个的产品其实还没用到AIGC, 实际上AIGC会让产品效果更好(点赞:F)

团员G:AI生成文本的可控性是不是还有一定问题,如果是教育的话,感觉还是需要更严谨和可控一些

讨论点2:AIGC文生图(发起人:anonymous

anonymous我们团队之前做过一些探索,所以分享一些关于文生图方向判断的genenral认识:

1- 面向大B很难,定制化需求多耗费人力

2- 现有公司通常面向SMB,finetune as a service,目的也是为了深挖场景,在细分领域上跳出来优秀企业

3- 面向专业创作者/设计师的创作工具只能说有潜力,但是距离能准确纳入工作流还有很大距离,需要很强技术积累

4- 定制设计,主要还是卡在供应链上,定制化和生产成本天然有矛盾。不过我们也看到了一些轻量产品,比如AI纹身贴,AI定制美甲等小工具

5- 2C切兴趣用户可,目前卡在商业化潜力上,需要有超越工具付费/内容消费的新商业模式,否则不值得投入增长,更多是和用户共同打磨技术

另外AI确实在游戏领域会更早、更相对完整的落地。不过生成asset本身不够的,需要更好融入游戏体验中,或者创造新游戏形式。

https://gmhub.com/jams/aijam2022 这是一个AI Game Jam活动,有几个作品还不错

(点赞:团员C、团员G

团员A:

finetune as a service,目的也是为了深挖场景,在细分领域上跳出来优秀企业。

哈哈同一阶段。如果就这么简单,还好,其他衍生的需要太多了

anonymous哈哈哈 是的 所以后续会期待看到这些企业分化。finetune本身没什么技术含量,但在细分领域的衍生需求引起的模型和工程化积累还是有意义的(点赞:团员A)

hanniman:关于第 3、4 点,挺好。多说一点,之前我在星球里分享案例“XXXX”时提过,从转化率角度去评估产品效果,就有可能给用户带来更多收入,这样更容易“算得过账”,用户就愿意付费。

如果只是当成一个工具,去硬怼多少准确率、节省多少时间,用户不容易心甘情愿的付费吧

这方面,大家有没知道一些更实战的信息?

团员F:有类似的,去年在前司内部做搜索广告,中小广告主非常懒,要么纯文本广告,要么随便搜了一个侵权配图。我们用大量广告图文怼,包括电商平台的一些图文对训了广告配图的模型,植入了点击转化的评分体系,根据用户prompt,定向采样点击转化较好的原始图片去生成新的图,既不侵权,也可以让广告转化率更高,广告主是愿意多付费的。因为每年都有侵权图片被起诉的案例,广告主、搜索平台赔偿。这有些类似photoroom。

团员E:其实这是个很有意思的方向,我们在做投放的时候经常会遇到素材侵权的问题,包括使用人像素材,也经常遇到相应的肖像权问题。

团员C程序化创意https://baike.baidu.com/item/程序化创意/16498669)是aigc的一个场景

团员E但是去年我们有接触过生成随机特征人像的项目,这样的项目,其实非常适合程序化创意的场景

hanniman:AI 纹身贴、AI 定制美甲,具体效果怎么样?有具体的报道/介绍文章没,或者具体一些的数据

团员DAI 美甲生成器|训练笔记之前做了一个 AI 美甲工具https://m.okjike.com/originalPosts/63bbc05f83734a967fc9a952)这个作者你们可以关注下,很有趣

讨论点3:AIGC+医疗(发起人:团员B

团员B医美这个,我觉得偏专业一点的手术效果模拟也是个不错的方向,因为可以帮助提高手术转化率,所以还是很有前景的。可扩展的方向也很多包括口腔治疗、畸形矫正等。但因为数据要求有点高,感觉还需要积累一段时间

会后补充基于F的文章“视觉AI+医美测肤”,衍生出“AIGC+医美”话题。

团员D这个可能对准确性要求太高

hanniman:看起来有机会,现在有已经在做或上线的产品没?或者报道文章

团员B有一些在做的,不过因为做的是3D模型,对患者人脸录入的要求高,所以To C没有推广开。比如这个《与传统整形填充相比,医美3D定制化产品有哪些优势?》https://www.zhihu.com/question/465139324/answer/2417898440 ),还有几家我有点忘了,得找找

hanniman:嗯 ,3D 之前更难做,明年应该会好很多

团员F医美,术后这个,我之前做算法岗的时候在新氧 就是尝试过了,第一数据问题,第二客户的接受程度没有那么高,第三现在算法还不能实现定向编辑。做过一个mvp版本,后来上线了三个月所有,反馈不好就下了。个人理解,aigc这种作为辅助和娱乐性质的可以,但是譬如涉及到医疗其他等专业领域,现在的生成没有那么定向,而且可解释性也不足(点赞:F)

团员D嗯是的 我个人觉得目前AI不适合对准确性要求过高的工作

讨论点4:AIGC+生产力(发起人:团员E

团员E其实我对AIGC的第一想法是它是个生产力工具,其意义在于让有想法而无技术的人,同样可以持有一个达到及格线的生产能力。

团员H

  1. 奔赴未来的我们需要面向未来的生产力工具https://m.weibo.cn/status/MmiYUpGbV

  2. 想象一下:对着产品随手拍几张照片,就可以让AI做产品摄影https://m.weibo.cn/status/Ma1Ldo396

  3. 最近尝试用不同的工作流,生成一些勤劳致富的富婆https://m.weibo.cn/status/MaAxctzhp

这是目前在创作领域看到一些工具产品

有些博主已经开始在分享自己用aigc优化工作流的经验了,如果能推广的话,应该直接就有付费意愿

讨论点5:头部大厂也在追AIGC,基于内部业务的基础衍生出来的2B服务(发起人:团员C

团员C火山的AI制作图文音频的能力,目前已经to b了 我了解到主要客户是广告公司。

团员E(火山的AI制作图文音频的能力)这个能力有demo吗?我其实有一个场景还挺合适的,用来给kol批量生产内容,比如小说推文这条赛道。

团员I搭车广告 XX厂爆火的AI绘画也to B了……需要可以找我

会后补充团员I曾分享一个有价值的信息点:抖音的AIGC的最佳实践https://mp.weixin.qq.com/s/8qaIm7zUbIPkztwjAJaJJw

团员A目前有明确的2B方向和客户了嘛

团员I目前还是 做互娱相册 修图的客户……上来就是我要抖音同款……

团员A哈哈哈,那对你们来讲,也算标品出售了吧

团员I对...通过标品去收更多定制化需求

讨论点6:gan和diffusion的区别(发起人:团员H)  

团员H:gan和这波text2image是什么区别啊

团员E:这个我不是很专业哈,但是从我浅薄的认知里,gan更擅长做迁移,它的核心是“像”。

团员I:扩散模型的空间关系,渐进式生成(可解释性),训练稳定性都更好。目前模型效率会比gan低

团员C:GAN的缺陷不能scale到很大的数据集和模型参数上,所以生成的内容比较局限,最主要的应用是人脸和人体相关(如著名的Deepfake),以及image到image的生成,比如美颜、风格化。

团员I:渐进式生成,是会先生成轮廓再生成细节,所以可解释性好些;空间关系,是整体空间的一些布局是一致的……核心还是扩散模型的逻辑是持续去噪声的逻辑。

以上内容,来自咱们社群“AI产品经理大本营” 1月12日的团员内部讨论,1月18日首发于知识星球,有删减;详情可点击“阅读原文”链接,或扫描下图二维码——

90bda509dc72d885b2b7197cb81e500f.png

[彩蛋1]

1、本周,在本公众号发布了80个最新的AI产品经理JD

  • 领域/关键词:

    大模型、AIGC

    /数字人/虚拟人、自动驾驶/智能座舱(语音、视觉)、NLP/KG/CV/ML/算法PM/AI平台/Saas、智能客服/产品运营、

    硬件/音箱/Iot/芯片、金融/健康/工业质检+AI等。

最近求职的AI产品同学,可以点击《内推福利_80个AI产品经理JD(覆盖9大城市、24家AI公司/部门)》、申请内推。‍‍‍

2、上周,在本公众号发布了“18位AI产品经理”的亮点信息和求职简历

  • 业务领域涉及关键词:虚拟人/AIGC、智能汽车/座舱/自动驾驶/机器人、智能客服/对话机器人/AI训练师、语音/声纹/NLP/CV、To C/To B/To G、AR/智能硬件iot/边缘计算等。

各家AI公司的CEO、业务负责人、hr同学,可以具体查看链接《简历推荐_18位AI产品经理》,申请获取简历

  • 注:如果有公司希望发布JD,或者有AI产品经理也想来公开求职,都可在其中找到提交途径。

c265f53fe79ff2f298b2d6cd77557718.png

[彩蛋2]

近期,我们在“AI产品经理大本营”里整理了一份“AIGC精华资料包”(42份干货报告)。

其中,不仅包含常见的行业报告,还有 AIGC / OpenAI /ChatGPT 等相关核心内容的图表展示,以及我们在付费社群里的部分原创内容。相比21天前的版本,本次又新增了7份报告——

ca5575ac950a80d4a0ac4dbea43f8700.png

领取方式在本公众号(hanniman)后台回复“1234,即可返回下载链接无需添加微信好友)。

-END-

引申阅读:公众号hanniman往期精选

---------------------

作者:黄钊hanniman,前腾讯PM,前图灵机器人-人才战略官/AI产品经理,10年AI、13年互联网经验;垂直于AI产品经理的第一社群(知识星球“AI产品经理大本营”,5年)和自媒体(公众号/知乎“hanniman”,8年),作品有《AI产品经理的实操手册》、200页PPT《人工智能产品经理的新起点》。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22870.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

音视频技术开发周刊 | 282

每周一期,纵览音视频技术领域的干货。 新闻投稿:contributelivevideostack.com。 畅谈音视频未来无限可能,2022音视频技术大会北京站 最新日程公布 2023年3月31日-4月1日,LiveVideoStackCon 2022音视频技术大会北京站,…

chatgpt赋能Python-python_cdo

Python-CDO: 数据处理的超棒工具 Python-CDO是一种极为实用的工具,用于在Python中使用CDO(Climate Data Operators)命令。CDO是一个功能强大的工具,用于处理气候和气象大型数据集,如Satellite and Reanalysis数据。而…

时间序列分析——基于R | 第2章 时间序列的预处理习题代码

时间序列分析——基于R | 第2章 时间序列的预处理习题 1.考虑序列{1,2,3,4,5,…,20} 1.1判断该序列是否平稳 x <- seq(1,20);x ## [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1.2样本自相关系数 max_lag <- 6 acf_x <- acf(x, lag.max max_l…

Google 人机验证(reCaptcha)无法显示解决方案

Google 人机验证无法显示解决方案 第一步 安装插件Chrome/Edge 电脑版Firefox 电脑版 第二步 配置插件原理参考文章 前言&#xff1a;为了防止机器人攻击&#xff0c;国外很多网站都使用了 Google reCaptcha 验证码。reCaptcha 对于国外用户非常的友好&#xff0c;但是… 对于国…

解决谷歌人机验证(Captcha)显示问题

文章目录 前言一、Header Editor 下载、安装与配置1. 插件下载2. 插件安装3. 插件配置 前言 由于谷歌服务在国内不可用&#xff0c;所以正常访问时某些网址时&#xff0c;经常会出现需要人机验证的问题&#xff0c;影响正常使用。在不使用科学上网的情况下&#xff0c;我们可以…

利用Python解决掉谷歌人机验证,全自动识别真的牛啊

一、接触前感受 第一次带我领略yolov5风骚的是这个视频&#xff1a;【亦】警惕AI外挂&#xff01;我写了一个枪枪爆头的视觉AI&#xff0c;又亲手“杀死”了它。 这样一来&#xff0c;我对人工智能打游戏产生了浓厚的兴趣&#xff0c;于是在B站查找人工智能基础&#xff0c;随便…

【开源项目】ChatGPT智能聊天系统后台管理解析

ChatGPT是likeshop近期新研发出来的一款AI智能聊天对话的产品&#xff0c;此系统是基于likeadmin-PHP开发的智能对话系统&#xff0c;ChatGPT是一种基于人工智能技术的聊天机器人&#xff0c;它可以与用户进行自然语言对话&#xff0c;提供各种服务和答案。ChatGPT的核心技术是…

checkra1n越狱工具下载地址

https://checkra.in/releases/ 虚拟机 checkra1n -26和-31错误 不支持虚拟机,需要在黑苹果&#xff0c;Ra1nUSB&#xff0c;Linux下越狱 AMD的黑苹果&#xff0c;错误&#xff0d;31&#xff0c; AMD的CPU使用checkra1n越狱黑苹果会报错-31 适用系统iOS13-13.3.1基本都是…

RabbitMQ快速实战以及核心概念详解

RabbitMQ快速实战以及核心概念详解 一、MQ介绍 1、什么是MQ&#xff1f;为什么要用MQ&#xff1f; ChatGPT中对于消息队列的介绍是这样的&#xff1a; 什么是消息队列 消息队列是一种在应用程序之间传递消息的技术。它提供了一种异步通信模式&#xff0c;允许应用程序在不同…

闰秒终于要取消了!一文详解其来源及影响

导读 | 第27届国际计量大会宣布最迟不晚于2035年取消引入闰秒&#xff0c;这一消息引起轰动。上一次闰秒产生&#xff0c;对Reddit、Mozilla、FourSquare等都产生了一定的问题&#xff0c;其中Reddit宕机时间超过1个半小时&#xff01;本栏目特邀腾讯后台开发工程师陶松桥&…

GPT-5暂时来不了 OpenAI悄然布局移动端

OpenAI彻底用GPT-4带火自然语言大模型后&#xff0c;互联网科技行业的大头、小头都在推出自家的大模型或产品。一时间&#xff0c;生成式AI竞速赛上演&#xff0c;“吃瓜群众”也等着看谁能跑赢OpenAI。 坊间预测&#xff0c;干掉GPT-4的还得是GPT-5。结果&#xff0c;OpenAI的…

悄然招募移动端工程师 OpenAI矛头调向移动端

2022年底&#xff0c;人工智能程序ChatGPT爆火&#xff0c;上线短短两月&#xff0c;就获1亿月度活跃用户&#xff0c;成为历史上增长最快的面向消费者的应用。随后全球的科技巨头都热火朝天地入局自然语言大模型赛道。不过推出ChatGPT的人工智能巨头OpenAI目前并不打算训练GPT…

马斯克宣布打造 ChatGPT 竞品!OpenAI CEO 给他泼了一盆冷水,GPT-5 或将大变

无脑增加 模型规模 已经落伍 当你在 ChatGPT 或者新 bing 里输入一个问题&#xff0c;AI 会调用它的云端大脑&#xff0c;思索一番&#xff0c;生成一段较为合理的回答。 而在 OpenAI 开发 GPT 时&#xff0c;也反复提到了参数正变得庞大&#xff0c;模型的规模也在逐代变得复…

死磕数据库系列(二十六):MySQL 高可用之单主、双主模型组复制配置实践

点关注公众号&#xff0c;回复“1024”获取2TB学习资源&#xff01; 前面我们学习&#xff1a;MySQL 高可用之组复制&#xff08;MGR&#xff09;技术的相关原理知识&#xff0c;今天我将详细的为大家介绍 MySQL 高可用技术组复制的单主、双主两种模型下的原理及配置相关知识&a…

chatgpt赋能python:Python中三角函数的使用

Python中三角函数的使用 介绍 Python是一种非常流行的编程语言&#xff0c;因为它非常易于学习和使用。Python中有很多实用的库和模块&#xff0c;可以帮助开发人员更轻松地完成各种任务。其中包括Python的数学库&#xff0c;其中包括三角函数。 三角函数是最基本的数学函数…

断网了,还能ping通 127.0.0.1 吗?[localhost与127.0.0.1区别]

1.应用场景 主要用于学习了解localhost 与 127.0.0.1的区别&#xff0c; 本质. 以及计算机关于本机地址是如何工作的。 为什么要有这个地址。 2.学习/操作 1.文档阅读 断网了&#xff0c;还能ping通 127.0.0.1 吗&#xff1f; 开发环境- 配置虚拟主机域名/hosts文件 2.整理输…

反调试与反反调试

参考文本 (190条消息) C 反反调试&#xff08;NtQueryInformationProcess&#xff09;_(-: LYSM :-)的博客-CSDN博客 Windows 平台反调试相关的技术方法总结—part 2 - 先知社区 C/C MinHook 库的使用技巧 - lyshark - 博客园 (cnblogs.com) (177条消息) C 反反调试&#x…

哈工大2023春计算机系统大作业:程序人生-Hello‘s P2P

摘要&#xff1a;以hello.c程序为例&#xff0c;文章探究了从C语言代码文件到进程回收这一过程。基于Linux操作系统&#xff0c;运用gcc&#xff0c;edb等工具&#xff0c;详细介绍了程序编译的流程&#xff0c;分析了运行可执行文件时系统的进程管理与存储管理原理与机制&…

Transformer模型的基础演算

作者 | Quentin Anthony、Stella Biderman、Hailey Schoelkopf OneFlow编译 翻译 | 贾川、徐佳渝、杨婷 1 引言 Transformer语言模型的许多基本重要信息可以通过简单计算得出。不幸的是&#xff0c;这些计算公式在自然语言处理&#xff08;NLP&#xff09;社区中并不广为人知。…

DetectGPT:使用概率曲率的零样本机器生成文本检测

DetectGPT的目的是确定一段文本是否由特定的llm生成&#xff0c;例如GPT-3。为了对段落 x 进行分类&#xff0c;DetectGPT 首先使用通用的预训练模型&#xff08;例如 T5&#xff09;对段落 ~xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本~xi进行比较。…