本日最新资讯共计 5 条。
OpenAI 放大招:ChatGPT 搜索功能无需注册人人可用,分钟级别解析全网信息
OpenAI 宣布 ChatGPT 搜索功能无需登录账户即可使用,用户可直接获取基于实时网络信息生成的答案,查看信息来源清单。与传统搜索引擎相比,ChatGPT 搜索可实现分钟级解析网络信息,能查看地图和本地景点图片,结果更具可信度和实用性。
来源:IT之家
谷歌发布Gemini 2.0 Pro,全型号刷榜,原生多模态,编程、物理模拟能力炸裂
谷歌发布 Gemini 2.0 系列模型,包括 Gemini 2.0 Pro、2.0 Flash 和 2.0 Flash-Lite。2.0 Pro 是谷歌最强的编码和复杂提示处理模型,配备 200 万 token 上下文窗口,支持谷歌搜索和代码执行工具。2.0 Flash 是高效主力模型,支持 100 万 token 上下文和多模态输入,适合高容量任务。2.0 Flash-Lite 是最具性价比的模型,性能优于前代 1.5 Flash,成本更低。
来源:Founder Park
前追觅中国区执行总裁郭人杰创业,「乐享科技」宣布完成近2亿元天使轮融资
前追觅中国区执行总裁郭人杰创立的「乐享科技」宣布完成近 2 亿元人民币的天使轮融资,由 IDG 资本领投,Monolith、经纬创投、真格基金等跟投,投后估值约 6 亿元。乐享科技成立于 2024 年,定位为全球科技公司,专注于 AI + 消费硬件市场,首款面向家庭场景的产品正在研发中。
来源:36氪
字节跳动推出 OmniHuman 多模态框架:图片+音频 = 逼真动画
字节跳动提出OmniHuman,基于扩散变换器的高保真人类视频生成框架。模型通过单阶段的音频和姿态驱动,能生成高质量的人类视频内容。支持文本、音频、姿态等多种输入信号,可生成从面部特写到全身的各种视频,适应不同风格。
来源:AI工具集
训练成本不到 50 美元,研究人员打造出媲美 OpenAI o1 的推理模型
斯坦福大学和华盛顿大学的研究人员仅花费不到50美元的云计算费用,训练出s1人工智能推理模型。模型在数学和编程能力测试中表现与OpenAI的o1和DeepSeek的r1等顶尖模型相当。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中提取推理能力,使用监督微调方法,耗时不到30分钟。
来源:AI工具集
发评论,有机会得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得奖励机会 查看奖励规则