Ideogram2.0发布/李沐在上交大发表演讲/麦当劳使用大模型制作广告/文心大模型日均调用量超6亿次

来源:曼巴比特 发布时间:2024-08-25 17:31:00

本周AI行业快讯速览:

1. 🖼️ Ideogram2.0发布:模型超越DALL·E3,免费使用次数

2. 🎤 李沐在交大:从大模型趋势到人生启示的精彩演讲

3. 🍔 麦当劳使用DreamMachine模型制作商业广告

4. 🛠️ 3个推荐的AI工具

5. 📰 更多AI资讯

6.💰 AI融资信息

 

Ideogram2.0发布:模型超越DALL·E3,免费使用次数

图片

Ideogram2.0文生图模型正式发布,支持中文、免费使用,生成图像质量超过DALL·E3。新版本包括iOS应用、API和图片搜索功能。模型支持多种图片类型和参数设置,包括MagicPrompt优化功能和颜色控制。用户可以通过简单的中文描述生成高质量图片,每天提供免费积分。测试显示,Ideogram2.0在图片质量和中文理解方面有显著提升。

💡 细节:
1. Ideogram2.0在人类评估测试中,图像质量和偏好强于DALL·E3和FluxPro。
2. 支持中文提示,图片质量、色彩、风格和语义理解大幅提升。
3. 界面分为文本提示框、图片类型和参数设置三大区域。
4. 新功能包括MagicPrompt(优化提示词)和颜色控制。
5. 生成效率提高,约40秒生成4张图。
6. 提供API,价格低于竞争对手。
7. 可选择公开或私密生成的图片。

🔍 为什么重要:
Ideogram2.0的发布标志着AI图像生成技术的重大进步。它支持中文并有免费使用次数,使得更多用户能够轻松创作高质量图像。超越DALL·E3的性能表明,AI图像生成领域竞争激烈,技术快速发展。这将为创意产业带来新的机遇,同时也可能引发关于AI生成内容的伦理和版权讨论。

李沐在交大:从大模型趋势到人生启示的精彩演讲

图片

李沐在上海交大母校进行了一场关于大语言模型(LLM)技术发展和个人职业生涯的演讲。他分享了对LLM技术趋势的见解,以及自己从学生到创业者的职业经历和感悟。

💡 细节:

1. 大语言模型技术趋势:预训练已成为工程问题,而后训练(如微调和应用优化)才是真正的技术挑战。高质量数据和改进的算法对提升模型效果至关重要。

2. AI应用发展:AI在文科白领工作中已有较好应用,工科白领领域仍需努力,而在蓝领领域(除自动驾驶外)还面临巨大挑战。AI真正改变世界可能还需要很多年。

3. 创业经验分享:创业需要强烈的动机和热爱,面临"婴儿般的睡眠"等挑战。创业公司的目标是推出产品并实现上市或被收购,这需要直面复杂的社会现实。

4. 职业发展建议:李沐强调选择比努力更重要,但前提是明确自己的目标。他建议定期反思和总结,每周、每季度、每年都要进行自我评估和规划。

5. 时代机遇与挑战:李沐认为当前是技术变革的最好时代,新技术带来了许多机会。但同时,这也是最具挑战的时代,年轻人需要付出比上一代更多的努力才能把握住这些机会。

🔍 为什么重要:
1. 技术洞察:李沐作为AI领域专家,他对LLM技术发展趋势的见解具有重要参考价值,有助于从业者和研究者把握技术方向。

2. 职业指导:李沐分享了自己在学术、企业和创业领域的丰富经历,为年轻人提供了全面的职业发展参考。他强调了选择的重要性,以及持续自我反思和提升的必要性。

麦当劳使用DreamMachine模型制作商业广告

图片

Luma平台即将发布DreamMachine 1.5版本,这是一个类似OpenAI的Sora的文生视频模型。日本麦当劳已经使用该模型制作了15秒的商业广告,引发了广泛讨论。

💡 细节:
1. DreamMachine 1.5版本在生成效率、视频质量、光影效果、语义还原和色彩搭配等方面都比前代有所提升。

2. 日本麦当劳使用该技术制作的广告引起了正面和负面的评论:
   - 正面评价认为这展现了麦当劳的创新精神,效果不错。
   - 负面评价指出视频缺乏连贯性,人物形象不自然。

3.  DreamMachine 1.0版本目前可免费试用,1.5版本预计也会提供免费试用,但有每日使用限额。

🔍 为什么重要:
1. 技术进步:DreamMachine 1.5的发布表明文生视频技术正在快速发展,质量不断提升。

2. 商业应用:麦当劳使用AI生成广告是一个重要的商业化尝试,可能会引领广告行业的新趋势。

3. 就业影响:随着AI视频生成技术的发展,可能会对创意制作行业的就业产生影响。

3个推荐的AI工具

VideoLingo:可以将视频进行字幕切割、翻译、对齐、配音,最终生成Netflix级别的字幕和配音。https://github.com/Huanshere/VideoLingo

芝士饼:芝士饼是蚂蚁集团推出的一站式AI应用创作平台,通过无代码开发和集成主流AI模型,降低AI开发门槛,助力企业和个人轻松构建个性化AI智能体,广泛应用于小程序开发、智能客服、内容创作、教育培训和健康管理等领域。

迅捷AI写作:迅捷AI写作是一款多功能的自动化文章生成器,支持多种语言,适用于内容创作、营销推广、学术写作等多种场景。它能快速生成高质量文本,并提供智能改写、续写等多样化功能,助力用户高效完成各类写作任务。

以上产品在曼巴比特官网搜索产品名称即可体验。

图片

 

更多AI资讯

百度大模型日调用量激增,AI成最强加速引擎

百度第二季度财报显示,文心大模型日均调用量超6亿次,半年内增长超10倍。百度智能云业务营收同比增长14%,AI收入占比升至9%。千帆平台已服务15万企业客户,帮助用户累计精调2.1万个大模型。百度搜索中18%的结果由AI生成,较上季度提高7个百分点。大模型正在重构百度多项业务,成为公司最强劲的加速引擎,推动云计算和AI应用快速发展。

Claude AI移动应用收入破百万美元 但仍面临市场挑战

Anthropic公司的Claude AI助手移动应用在iOS和Android平台上的收入突破100万美元,其中近一半来自美国用户。虽然Claude达到这一里程碑的速度快于竞争对手如Copilot和Perplexity,但仍落后于ChatGPT。美国是Claude最大的市场,占下载量32.5%和收入48.4%。尽管如此,Claude在移动消费市场仍面临挑战,特别是来自Apple Intelligence的竞争。相比之下,Claude在Web端的表现更为出色,增速甚至超过了ChatGPT。

昆仑万维推出AI短剧平台SkyReels,开启一键成剧新时代

昆仑万维推出全球首个AI短剧平台SkyReels,集成视频大模型与3D大模型,实现一键成剧。平台包含剧本生成、角色定制、分镜设计、视频拍摄与合成等功能,大幅提升短剧制作效率。背后的技术创新包括自研剧本大模型SkyScript、分镜大模型StoryboardGen和创新平台WorldEngine。昆仑万维押注AIUGC市场,致力打造以IP为核心的综合UGC平台,并开发通用大模型底座,横向延伸模型能力至音乐、图像、视频等领域。

Runway推出Gen-3AlphaTurbo:免费高效图像生成视频新功能

Runway发布Gen-3AlphaTurbo图像转视频功能,生成效率比之前模型快7倍,价格减半。新功能对所有用户免费开放试用。使用步骤简单,用户可上传图片,输入提示词生成视频。建议上传简洁图片并使用清晰提示词以获得更好效果。生成时间约40秒,可选择5秒或10秒视频长度。该功能目前在Runway官网可免费试用。

 

不融资打造SaaS矩阵,Lempire 6年实现2600万美元收入

Lempire是一家通过自主创业方式成长的SaaS公司,在6年内发展出5款产品,年度经常性收入达2600万美元。创始人Guillaume以1000美元启动资金开始,通过冷邮件营销获得第一个企业客户,坚持公开分享创业经验。公司采用自建和并购策略扩展产品线,收购的两款产品收入翻了10多倍。Lempire保持精简团队,注重有机增长,强调从用户需求出发构建产品,是Bootstrap方式创业的成功案例。

Claude AI移动应用收入破百万美元 但仍面临市场挑战

Anthropic公司的Claude AI助手移动应用在iOS和Android平台上的收入突破100万美元,其中近一半来自美国用户。虽然Claude达到这一里程碑的速度快于竞争对手如Copilot和Perplexity,但仍落后于ChatGPT。美国是Claude最大的市场,占下载量32.5%和收入48.4%。尽管如此,Claude在移动消费市场仍面临挑战,特别是来自Apple Intelligence的竞争。相比之下,Claude在Web端的表现更为出色,增速甚至超过了ChatGPT。

AI肌肉美化应用GigaBody走红 反映男性颜值经济潜力

一款名为GigaBody的AI肌肉美化应用在中国区iOS下载榜登顶。该应用被称为男性版美图秀秀,通过AI技术实现一键增肌效果,引发社交媒体热议。GigaBody由加拿大团队开发,在中国意外走红后带动了其他亚洲地区的下载量。尽管下载量可观,但付费转化率较低,仅为0.18%。业内人士认为,GigaBody反映了男性对颜值管理的兴趣增长,但持续性付费需求仍有待挖掘。

智元机器人发布多款人形机器人新品 推出具身智能技术路线图

智元机器人发布多款人形机器人新品,包括面向量产的远征A2系列和开源的灵犀X1系列。远征A2系列包括三款适用不同场景的机器人,在动力、感知、通信和控制等方面有多项技术升级。公司还提出了具身智能G1至G5的技术演进路线。灵犀X1系列主打开源和DIY,将提供免费的设计图纸和软件框架。智元机器人还展示了具身数据采集方案AIDEA,计划在四季度开源大量真机和仿真数据。

亚马逊开源RAGChecker:为RAG系统提供全面诊断的新工具

亚马逊上海人工智能研究院推出了名为RAGChecker的诊断工具,用于对检索增强生成(RAG)系统进行全面评估。该工具提供细粒度、全面、可靠的诊断报告,包括整体指标、检索模块指标和生成模块指标。RAGChecker采用基于声明级别的蕴含关系检查,提供涵盖忠实度、上下文利用率、噪声敏感度和幻觉等方面的指标。该工具已与LlamaIndex集成,为开发者提供了深入了解和优化RAG系统的有力支持。

AI融资信息

AI学术搜索引擎Consensus获1100万美元融资,月活用户达40万

AI学术搜索引擎Consensus完成1100万美元A轮融资,由UnionSquareVentures领投。该公司拥有40万月活跃用户和1.2万名付费用户,主要为学生、医生和研究人员提供服务。Consensus使用多种AI系统,包括GPT-4,来总结可靠学术出版物的文献,回答用户查询。公司预计今年ARR将达到150万美元。Consensus的目标是让科学家和普通用户更容易理解高质量研究,其客户包括斯坦福大学。

Story融资8000万美元,估值22.5亿美元,打造AI时代知识产权区块链平台

Story公司宣布完成了8000万美元的融资,估值达到22.5亿美元。该公司旨在利用区块链技术建立一个平台,帮助知识产权(IP)所有者更有效地追踪其内容的使用情况。CEO S.Y. Lee表示,他们的目标是构建一个可持续的IP生态系统,以适应数字消费者和建设者的需求。Story的区块链平台允许创作者声明内容所有权,设置使用参数,并允许他人许可和使用。目前,Story已经通过与时尚设计工具Ablo、日本漫画平台Sekai和艺术合作初创公司Magma的合作,吸引了200多个团队和超过2000万个可寻址IP注册其平台。该公司计划利用新资金继续开发产品,并计划在今年晚些时候进行商业发布。

Opkey完成4700万美元B轮融资,AI助力企业ERP软件测试

Opkey,一家基于AI的企业资源规划(ERP)测试平台,宣布完成了4700万美元的B轮融资。该公司的AI平台帮助组织持续测试财务、人力资源和其他ERP软件。Opkey已经拥有超过200家大型企业客户,并与KPMG和PwC等系统集成商建立了合作关系。此轮融资由PeakSpan Capital领投,包括UST Global、Verica、Vertical和印度YouNest等现有投资者参与。Opkey的总部位于加利福尼亚州的都柏林,该公司之前仅筹集了1200万美元,但未透露当前的估值。

AI广告制作平台Creatopy获1000万美元A轮融资

Creatopy公司获得1000万美元A轮融资,由3VC和PointNine共同领投。该公司利用人工智能技术实现广告制作自动化,主要面向顶级品牌和代理商。Creatopy已拥有5000多个客户,专注于广告创建、规模化、个性化和自动化。新任CEO Dan Oros强调公司在广告制作领域的专业优势,特别是在规模化和自动化方面。

 

往期推荐:

不会写代码?我用Claude+扣子制作了一个AI搜索产品

打造AI时代的网站:如何通过文心智能体轻松被百度收录(1)

 

作者简介:产品经理TD,写过代码,创过业的大模型应用产品经理,目前是自由职业。

我通过Cluade3.5 Sonnet大模型开发了两个AI产品,分别是快标书AI(投标方案撰写)和曼巴比特AI导航站(这里有很多精选的优质AI产品)。

不会写代码?我用Claude+扣子制作了一个AI搜索产品

如果你对我的产品感兴趣,期待和你交流。