本日最新资讯共计 5 条。
Runway推出AI生成式角色表演工具:Act-One,可生成虚拟角色动画
Runway公司推出了一款名为 Act-One 的AI生成式角色表演工具,能够将视频和语音输入转换成任意风格的虚拟角色动画,同时保持表情、语音和口型的同步。Act-One简化了动画制作流程,仅需一台普通摄像头即可制作逼真动画,支持多种角色风格,并能处理复杂的多轮对话场景。
Genmo公司宣布开源其顶级视频生成模型Mochi 1,能生成每秒30帧、5.4秒长的视频
Genmo公司宣布开源其顶级视频生成模型Mochi 1,模型展示了卓越的运动质量和提示遵从性。Mochi 1基于100亿参数的Asymmetric Diffusion Transformer架构,能生成每秒30帧、5.4秒长的视频。模型初始分辨率为480P,通过超分可提升至960P。
Stability AI发布了自家最强的模型Stable Diffusion 3.5,包含三个版本
Stability AI发布了 Stable Diffusion 3.5 模型全家桶,包含三个版本:Large、Large Turbo和Medium。模型能满足不同用户需求,从专业用途到消费级硬件的“即插即用”。Large版拥有80亿参数,适合高分辨率专业应用;Large Turbo版快速生成高质量图像;Medium版则在质量和易用性间取得平衡。
Anthropic 推出升级版 Claude 3.5 Sonnet 模型,可操控用户电脑
Claude 发布新版本的 3.5 Sonnet 和新发布的 3.5 Haiku,能力都有大进步。这次 Claude 发布了一个重磅新功能——一个新的「计算机使用」API,该模型可以模拟按键、按钮点击和鼠标动作,实质上模拟了一个人坐在电脑前的操作。开发者现在可以通过 API 指导 Claude 像人类一样操作计算机, 包括观察屏幕、移动鼠标、点击按钮和输入文字。
讯飞星火推出“星火插件”,支持划词搜索、翻译、解释,生成网页摘要
讯飞星火推出“星火插件”,支持划词搜索、翻译、解释,生成网页摘要,以及一键收藏信息等功能,提升用户的信息检索、阅读和知识管理效率。兼容主流浏览器,支持个性化设置和跨平台同步。适用于学术研究、技术文档阅读、多语言内容理解、信息筛选总结以及个人知识管理等场景。
入行365 – AI社群
发评论,有机会得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得奖励机会 查看奖励规则