11月18日最新AI资讯 – 入行365 | AI社群
本日最新资讯共计 5 条。
讯飞星火多模态交互大模型上线,数字人/语音/视觉支持一键全调用
讯飞星火多模态交互大模型正式上线,实现语音、视觉、数字人交互三合一,支持一键调用。模型首发超拟人数字人技术,能精准匹配语音内容生成表情动作,实现跨模态语义一致性,AI情感表达真实连贯。同时支持多模态视觉交互,能全面感知背景场景、物流状态等信息。
来源:讯飞开放平台
谷歌 Gemini 发布苹果 iOS 版 App:集成灵动岛,支持 AI 语音聊天
谷歌推出了专为iPhone设计的 Gemini AI应用,集成了iOS的灵动岛功能,支持用户通过文本或语音与AI进行互动。新应用还带来了Gemini Live功能,用户能在灵动岛和锁屏上直接管理AI对话,无需切换应用。目前,已在澳大利亚、印度、美国和英国等地区上线,国区尚未支持。
来源:IT之家
OpenAI 桌面版 ChatGPT 应用登陆微软 Windows,支持拍照识别及语音交流
OpenAI 发布了面向 Windows 10/11 用户的桌面版 ChatGPT 应用,支持拍照识别和语音交流。用户可通过快捷键快速访问,上传文件和图片进行问答。桌面版包含网页版大部分功能,但高级搜索和模式需订阅20美元/月的ChatGPT Plus。Windows版还支持截图和自定义快捷键,提供GPT-4o、DALL-E 3等模型。
来源:IT之家
通义千问的代码模式正式上线,新功能支持用户无需编程知识即可生成应用,支持前端页面、设计素材、生日贺卡、数据图表、小游戏和精美简历等。代码模式背后的技术基于Qwen2.5-Coder(在多项基准评测中表现优异的开源代码模型)。用户现在可以通过通义官网体验这一创新功能。
来源:通义
即梦AI视频生成模型重磅更新,推出S2.0 Pro和P2.0 Pro两大模型
即梦AI视频生成模型今日更新,推出S2.0 Pro和P2.0 Pro两大模型。S2.0 Pro以首帧一致性和细节还原著称,能精确描绘原作并融入创意。P2.0 Pro则以高提示词遵循能力,能将复杂创意转化为视频内容。用户可通过即梦App或官网选择模型,实现灵感即刻成片,享受AI视频创作新体验。
来源:AI工具集