互联网2024年9月25日报道丨AI资讯早报
字节跳动发布两款豆包系列视频模型:生成效果超可灵AI
9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,一举发布了两款AI视频生成大模型,分别为豆包视频生成-PixelDance、豆包视频生成-Seaweed,面向企业市场开启邀测。
根据火山引擎方面介绍,此前国内外大部分的视频生成模型大多只能完成简单的指令,而豆包新出的两款视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。
据火山引擎介绍,豆包视频生成模型基于 DiT 架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题。
<iframe src="//player.bilibili.com/player.html?isOutside=true&aid=113192034504837&bvid=BV1kAsYe7EYw&cid=25984827588&p=1&autoplay=0" frameborder="no" scrolling="no" allowfullscreen="allowfullscreen"></iframe>
有国内创作者在抢鲜体验新款的豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,更加接近于摄像机的实拍效果。
其中,视频生成模型能遵从复杂 prompt,解锁时序性多拍动作指令与多个主体间的交互能力;可以让视频在主体的大动态与镜头中炫酷切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力;在一个 prompt 内实现多个镜头切换,同时保持主体、风格、氛围的一致性。
此外,豆包大模型家族还推出了AI音乐生成模型和同声传译大模型。
目前,新款豆包视频生成模型正在字节跳动旗下的“即梦AI”进行小范围测试,未来将逐步开放给所有用户。
ChatGPT重磅新功能「高级语音模式」全量上线
当地时间9月23日晚间,OpenAI 官方发布通告,人工智能对话机器人 ChatGPT 新版「高级语音模式」将在本周内向所有 Plus 和 Team 用户全量推送。
需要注意的是,新版高级语音模式每天的使用时间也是有限制,并且这个限制也会有所变化,当用户的使用时间剩余 15 分钟时,系统就会发出提醒。这意味着,想要将其作为 24 小时无话不谈的「AI 密友」目前还不太可能。
目前判断你是否已经获得新功能推送的资格有两种简单的方法:
① 第一种,如果获得资格推送,当你首次访问语音模式时,App 中将显示以下通知:
② 第二种方法则是通过检查 ChatGPT 内置的智能合成语音风格的数量来判断。
此前,ChatGPT 支持五种预设语音风格,但后续由于「Sky」语音风格与斯嘉丽·约翰逊的法律纠纷而遭到下架。
「Apple智能」对手机存储空间要求进一步提高
此前,有科技媒体报道称,苹果即将上线的人工智能服务 Apple Intelligence「Apple智能」只支持 iPhone 15 Pro 以上机型及 iPhone 16 系列新品,主要原因是手机的运行内存 RAM 需要至少 8GB,但对于存储空间 ROM 的描述则没有披露。
近日 iOS 18.1 Beta 版本开放测试,在其官方发布的指导手册「iPhone 使用手册」中指出,「iPhone 装置需要 4GB 存储空间」,而在文档最下方还标注「随着更多功能的推出,装置上 Apple 智能的储存要求将进一步提高」。
这意味着,此前使用 128G 容量的 IPhone 可能不太足够,如果想要使用新功能「Apple智能」,或许需要置换存储空间更大的 iPhone 版本。否则,用户在安装 APP 的时候就需要尽可能降低需求了。
腾讯发布起居家用机器人「5号」:可协助老人起床
腾讯旗下的人工智能研究所「腾讯 Robotics X 实验室」在其官方账号发布文章称,该实验室最新研发成果人居环境机器人「5 号」(The Five)正式对外亮相,并且发布了一则宣传片。
官方表示,小五作为腾讯 Robotics X 实验室最新一代机器人,集合了此前多代机器人研发的核心能力,融合了四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项自研技术。
<iframe src="//player.bilibili.com/player.html?isOutside=true&aid=113192588086068&bvid=BV1UKsaexENu&cid=25986665746&p=1&autoplay=0" frameborder="no" scrolling="no" allowfullscreen="allowfullscreen"></iframe>
通过该宣传视频,我们可以看到小五可以取拿物品、协助老人起床翻身、为老人推轮椅等等老龄化的康复疗养服务,未来有望进入医院、养老院、福利机构以及个人家庭等应用场景。目前该机器人还处于内测阶段,也没有发布定价策略方面的信息。
东半球最强法务部出手:任天堂利用AI识别马里奥图像
据外媒 The Verge 最新报道,近日,一款经由人工智能技术驱动的版权图像识别 AI 工具,成功让包含 AI 生成的任天堂游戏马里奥的图像帖子得到删除。该 AI 工具属于一家名为 Tracer 的公司,该公司利用人工智能识别技术出了版权图像,并代表任天堂方面,向这些帖子的发布者下达了警告通知。
根据 The Verge 收到的电子邮件爆料,人工智能识别工具 Tracer 向一名推特(X)平台发布帖子的作者寄出了一份包含美国《数字千年版权法》(DMCA)的通知。Tracer 主要服务企业客户,提供人工智能识别服务,据称能够识别在线的商标和版权侵权行为。
Tracer 寄送的下线诉求信息包括——将识别为侵犯任天堂马里奥形象的帖子删除。
The Verge 在报道中表示,因为帖子已经被删除,无法看到该作者发布的马里奥图像长什么样子,以及具体使用了哪种 AI 生成手段创作马里奥的图像。