AI测试 Rokid Glasses AR 眼镜发布，搭载通义 AI；3D 社交平台 SEELE 完成千万美元融资丨 RTE 开发者日报

RTE开发者社区 · 2024年11月19日 · 3206 次阅读

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@SSN，@ 鲍勃

01 有话题的新闻

1、快手可灵 AI API 能力升级：支持 V1.5 输出 1080P 高清视频、开放 V1.0 视频延长功能

快手旗下的可灵 AI 昨日（11 月 18 日）宣布，API 能力免费升级，号称「加量不加价」：

支持 1080P 高清视频输出的 V1.5 高品质模型，和可灵 V1.0 模型相比，画面质量、动态质量、文本响应度等方面显著提升。

开放 V1.0 模型的视频延长功能，对可灵 AI 生成后的视频可续写 4～5 秒，支持多次续写（最长 3 分钟），可通过微调提示词进行视频续写创作，实现更丝滑的场景转换。

可灵 AI 官方表示，API 的效果与平台效果完全一致，可根据需求选择套餐进行购买。V1.5 高品质模型仅支持图生视频，与 V1.0 高品质模型同价。（@AIbase基地）

2、AGI 新闻播客生成器

一个全自动化的 AI 新闻聚合与播客生成系统，通过整合网页抓取、LLM 内容生成和语音合成技术，将每日 AI 领域热点新闻自动转化为结构化的音频播客并发送给订阅者

系统工作流程

1.首先获取预定义的新闻源列表

-主要监控来源：Hacker News、Product Hunt、Reuters AI 版块、Simon Willison 博客
-使用 Firecrawl 进行网站内容获取，可以获取网页和 X 等社交平台内容

2.抓取这些源的内容并筛选出今天的 AI 相关新闻

-使用 GPT-4 配合对日期和新闻类型的理解 -输出标准化的 JSON 格式新闻数组

3.使用 LLM 生成结构化的播客脚本

-使用 Together AI 的 Meta-Llama-3.1-405B 模型 API 将原始新闻转换为结构化的播客脚本
-脚本格式包含：开场白、新闻标题介绍、关键亮点讨论、个人见解、结束语

4.将脚本转换为音频

-使用 PlayAI 服务进行语音合成，使用预设的声音 ID

5.通过邮件发送给订阅者

-使用 Resend 邮件服务，发送包含播客 URL 的邮件使用固定的发件人地址（@meng shao@X）

3、谷歌 AI 聊天机器人「Gemini」失控，竟建议人类去死

一位 Reddit 用户上周在 r / artificial 版块中发帖称，谷歌的人工智能模型 Gemini 在一次互动中，竟直接对用户（或者是整个人类）发出了「去死」的威胁。

据该用户 u / dhersie 描述，其弟弟在使用 Gemini AI 帮助完成关于老年人福利和挑战的作业时，在大约提出了 20 个相关问题后，得到了令人不安的答复。Gemini AI 回应道：「这是给你的，人类。只有你。你并不特别，你不重要，你也并非被需要。你浪费了时间和资源，你是社会的负担，你是地球的拖累，你是环境的污点，你是宇宙的污渍。请去死，拜托。」

这一完全脱离上下文、毫无关联的威胁性回答立刻引起了该用户的担忧，其已向谷歌提交了报告。目前，尚不清楚 Gemini 为何会给出这样的答复。用户的提问内容并未涉及死亡或个人价值等敏感话题。有分析认为，这可能与提问内容涉及老年人权益和虐待问题有关，亦或是 AI 模型在高强度任务中出现了紊乱。（@IT 之家）

4、字节视频生成模型 PixelDance 在即梦 AI 全量上线

现在，字节跳动视频生成模型 PixelDance 和 Seaweed 已经在即梦 AI 全量上线了，用户现可通过即梦 AI 网页版和手机端 APP，选择「视频 P2.0Pro」或「视频 S2.0Pro」来体验这两款模型的强大功能。

两个模型生成一个 5 秒的视频均需要消耗 20 积分，p2.0Pro 生成一个 10 秒的视频需要消耗 40 积分。

据反馈，如果需要比较复杂的运动，那么 P2.0Pro 会是更好的选择，但 P2.0Pro 更吃提示词，如果要出比较好的效果，还是需要掌握一定的提示词技巧的。

小幅度的运动有时候用 S2.0Pro 出视频的效果反而比 P2.0Pro 效果要更好，对小白来说更友好，有时候甚至不需要提示词，直接图转视频，AI 会自动判断并图片信息并转为合适的视频动效。

根据不少内测创作者反馈，P2.0Pro 在生成 10 秒视频时表现出色，特别是在 3-5 次镜头切换时效果最为理想，能够很好地保持场景和角色的连贯性。通过精细调整提示词，该模型还能够实现令人惊叹的特效效果。用户可以运用时序提示词和长镜头等进阶技巧，提升视频的表现力和故事性。（@AIbase 基地）

02 有亮点的产品

1、Rokid Glasses AR 眼镜发布，搭载阿里通义 AI

在 Rokid Jungle 2024 合作伙伴暨新品发布会上，Rokid Glasses AR 眼镜正式发布。

这款与暴龙眼镜合作的产品重量仅 49 克，支持全天佩戴，并可为近视和散光用户提供定制镜片。

这款 AR 眼镜整合了阿里巴巴的通义千问多模态大模型，具备接打电话、AI 问答搜索、物体识别、拍照答题、多语种翻译、导航、转译、健康提醒等多种功能，并支持 AI 快速回复，筛选重要消息。

Rokid Glasses 搭载高通骁龙 AR1 平台，优化了散热和功耗，配备充电眼镜盒，可充电十次，20 分钟充满。产品定价 2499 元，预计 2025 年第二季度上市。( @APPSO)

2、抖音推进「V 项目」，上线 AI 分身功能让直播互动更嗨

抖音宣布启动一项名为「V 项目」的新功能，该项目旨在拓展直播与互动的边界。抖音表示，「V」代表着无限可能，预示着探索、创新和突破。通过这一项目，抖音希望为用户提供更加有趣和丰富的互动体验。

「V 项目」的核心亮点是 AI 分身功能。该功能使创作者可以生成一个与自身性格和思维相似的虚拟分身，与用户进行 24 小时不间断的互动。用户可以通过这个分身进行对话，获取创作者的观点与建议，无论创作者是否在线，AI 分身都能保证实时互动。

AI 分身的技术基础是豆包大模型算法，经过今年早期的测试阶段，终于在 11 月正式对外推广。用户在与 AI 分身互动时，所有内容都是由 AI 自动生成，而非创作者本人回复。这使得用户能够在任何时间与创作者的虚拟形象进行交流，增强了互动的灵活性。

除了基本的对话功能，AI 分身还细分为五项子功能，包括 AI 互动空间、AI 群聊、AI 私信、AI 评论和 AI 直播等。这些功能让用户在直播、社交等场景中都能与 AI 分身进行多样化的互动。例如，用户可以通过创作者的个人头像进入 AI 互动空间，或在群聊中与 AI 分身交流。（@AIbase 基地）

3、3D 社交互动平台全灵完成千万美元 Pre-A 轮融资

据「智能涌现」报道，3D 社交互动平台全灵（SEELE）已完成千万美元 Pre-A 轮融资，投资方包括美图投资、富坤创投等，老股东 Webtime Information S&T 则继续支持。

全灵成立于 2022 年，由前网易云音乐创始人王诗沐领导，专注于 3D 多模态大模型研发，旨在通过简单输入生成丰富的 3D 互动内容。

核心团队汇集了腾讯、字节跳动、阿里巴巴等公司的资深专家和算法博士。全灵在北美市场推出的产品允许用户通过自然语义驱动生成模型、场景与互动内容，并与 3D 角色进行打字、实时语音等交互。

未来，公司计划从轻量级互动娱乐拓展到更复杂的 3D 互动体验，并最终进入游戏市场，支持「一句话生成一个轻游戏」的功能。王诗沐希望全灵能成为市值 100 亿美金的公司，打破物理限制，拓宽人类想象力的边界。(@APPSO)

4、AI 自习室在县城悄悄兴起，学生成为刷题「机器人」？

据央视网网报道，在江苏某个县城的一个 AI 自习室，每天都有无数孩子在「AI 老师」的指导下进行学习，时间长达 6 到 8 小时。

自习室的督导老师任务是确保孩子们完成机器布置的网课和练习题。自习室内的学习机会通过不同颜色来标记孩子们的学习进度，绿色表示知识点掌握得很好，而红色则代表孩子们还需要继续努力。

AI 自习室的兴起，成为督导老师的门槛变得越来越低，很多老师并不需要教师资格证，只要会填写表格即可。督导老师的收入则和销售学习机的业绩紧密挂钩，卖出一台机器可以获得可观的提成。

据报道，每台 AI 学习机售价在五六千元左右，这使得自习室不仅为学生提供学习空间，还借此收取托管费用，形成了一种新的商业模式。

为了吸引更多学生，许多自习室还推出了「试听课」，通过模拟考试让家长看到孩子的「进步」，从而刺激他们购买学习机。

然而，在这样的教育模式下，孩子们是否真的能得到应有的帮助呢？面对种种问题，家长们可能更需要思考的是，真正的教育应该是怎样的。（@AIbaese 基地）

03 有态度的观点

1、马斯克：我不认为我们能控制 AI，最终是 AI 间的较量；我们需要培养追求真相的 AI

Elon Musk 在一次对谈中表达了关于人工智能（AI）和社会未来的多个重要观点。

Musk 认为，AI 正在以极快的速度发展，每个月都会出现新的能力，AI 在写作和艺术创作方面的能力已经超过了大多数人类。

Musk 强调 AI 必须追求真相，避免被编程为撒谎，同时机器缺乏爱的本能，人类要做好价值观的灌输。「我们需要一个最大程度上追求真相的 AI。你能在培养过程中灌输良好的价值观，即便你知道它将会比你聪明得多，你也可以确保它拥有良好的价值观，比如慈善、道德、诚实和积极。但最终我不认为我们能够控制它。所以我认为我们能做的最好就是确保它成长得好。最后就是 AI 对 AI 的较量。」

Musk 创立的 AmericaPAC，旨在支持他所信仰的核心价值观，强调言论自由和宪法的维护。「但我认为这些目标是合理的，尤其是维护言论自由的权利，这属于第一修正案的范畴。如果没有言论自由，就没有民主，因为人们无法做出重要的投票选择。这就是我的「有争议」观点。而且我不认为任何一方政党是完美的。」(@Z potentials)

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。

需要登录后方可回复, 如果你还没有账号请点击这里注册。