AI测试 在这里游玩和创造,见证实时互动和 AI 的融合爆发丨年末场 RTE Open Day@RTE2024 回顾

RTE开发者社区 · 2024年11月04日 · 84 次阅读

RTE2024 第十届实时互联网大会上周末在北京圆满结束了,不知道大家体验交流得如何?可能是因为本来入秋的北京悄然升温,又或者是那两天的观众都很热情,25-26 号的活动现场特别像是一场夏天的聚会。

RTE Open Day 马不停蹄来到了第五期,今年已经有三四十个 “实时互动 +” 的项目依次亮相,在 Open Day 展区被更多感兴趣的朋友所了解。这次依然为大家提供了众多好玩的体验,以及围绕 “实时互动 +AI” 的观点讨论。

而每次活动结束我们都会迎来一批新的 RTE builders 加入社区,队伍越来越活跃壮大!这一次还要额外欢迎一批毛孩子们!

👓 在 RTE Open Day 玩起来

让观众能够身临其境地触摸、聆听、交互实时互动前沿技术,与产品背后风采各异的开发者和创业者一对一交流,是 RTE Open Day 的唯一宗旨。

这次 Open Day 开发者市集,除了社区自己的展位,还有 17 家 RTE 开发者社区成员和超音速计划项目参与,在酒店 L 型的回廊里一直延伸到尽头。门楣围绕着一圈酷炫的灯牌。

以及,虽然活动日期刚好错开了 “1024” 程序员节,但是终点有一枚特制的闪闪发光程序猿灯牌为开发者亮起。

从社区成长起来的 TEN Framework 开源框架已经不是第一次在 Open Day 亮相了。过去短短的一个月时间内, 这个实时多模态 AI Agent 框架快速接入了 OpenAI Realtime API,并且做了几个新的 use case 供开发者体验:语音剧本杀 “西部世界”,电脑系统级 AI 语音助手 “除你武器”,主播与 AI 直播共唱 “Swan&frog”。

超次元旗下的超梦 AI, 是一个集真人拍摄、AIGC 拟真、AIGC 二次元等多型态自定义角色和多模态场景交互建立起来的 AI 陪伴社区,以满足用户多样化情感陪伴。现场观众可以在小程序端体验,而他们对超梦 AI 的商业化也非常感兴趣。

开物量子开发者社区 是一个开放技术社区,聚焦量子计算交流与学习、量子 AI 算法探索与开发、量子计算真机研究与使用。在现场可以体验到 “N 皇后闯关” 之类可代表量子 AI 算法探索的经典案例。开物量子社区也欢迎更多的算法工程师关注、参与~

作为超音速计划的一员,Gotin 一直在结合 RTE 的领域探索新应用落地的方向。他们专注于虚拟空间及体验综合服务平台,打造未来虚拟交互的新方式,比如车企的线上车主俱乐部,银行的线上营业厅等等。这次在展位也可以体验到 Gotin 为保时捷定制的 “旅行猪猪” 交互,可以给粉红猪猪投喂食物,让它环游世界并带着明信片回来。

XSwitch 是社区主理人之一杜金房老师的项目。XSwitch 致力于连接一切音视频、AI 设备和服务,可以实现话机外呼、视频会议、AI 助手交互等等功能。在现场,你真的可以给 OpenAI 打电话。

《言灵计划:中二嘴炮大作战》 是一款由 AI 驱动的演出派对游戏。玩家可以通过 AI 生成自己的言灵,而在对战环节玩家输入的文本或者语音指令会转化为相应的动作。

为品牌打造互动体验的壹墨互动 Emerge 每次都会展开一个三折屏,通过 iPad 面板与之互动响应,为观众展示不同的客户案例,非常吸引目光。Emerge 也经常带来一些 geek 的小玩意儿。这次是一个拥有屏幕和传感器的赛博骰子 “EM-DICE”。在生活中面临多种抉择时,“摇一摇” 让它来决定。玩过之后好想拥有。

萤火空间, 专注于混合现实(MR)企业级软硬件产品的研发以及开发。用社区朋友费费的话来说就是,“100 度 FOV 的 OST 自研一体机方案,20 个人做的软硬件,太太太硬核了!!!”

ViiTor AI 提供视频翻译、音色克隆、AI 虚拟形象视频、语音合成、音色库等产品服务,以及 19 种语言的实时翻译功能。用 ViiTor AI 和 ViiTor 实时翻译这两款 App 就可以实际体验。观众在现场也详细询问了关于产品支持 API 的功能及实现程度、效果准确度、产品的技术架构或底层逻辑等细节问题。

《PixelHack》 是一款 XR 射击游戏,通过 RTE 实现多人实时在线作战,玩家们可以在同一地方实时看到其他玩家的位置动作,通过语音互相沟通。很多现场观众试玩之后都非常喜欢游戏里复古像素和 3D 的结合效果,确实想起了小时候玩游戏的回忆。

Fish Speech 是 Fish Audio 团队自主研发的语音合成大模型。这也是一个开源项目,允许用户通过 15 秒的参考音频快速克隆出音色、语调、韵律、情感。有助于开发一些视频创作、有声书、AI 教育等场景下的应用。现场演示了不同的 TTS 音色,而观众对于开源项目总是更关心开源进展和后续计划。

实时编程工具 MicroBlocks 带来了 XGO 的桌面机器人,让大家感受积木编程即刻实时驱动机器人。现场是蓝牙传输,接上 RTC 就能远程控制,想象空间就更大了。这个在现场激发了一些感兴趣的观众,也想要自己买个桌面机器人来做一些好玩的应用场景。

尽管 Open Day 有时候会邀请老朋友,但我们绝对保证每一次的体验都是不一样的。上一次亮相 Open Day 的 蚁触科技 这次装备了全新升级的触感沙发,在赛车、演唱会、电影等一系列场景中的体验会更细腻丰富。还有新增的冥想场景,是以触觉作为特别的导师,引导现场体验者进入心流状态,即使在会场的环境里,也容易心静下来(甚至差点睡着了)。

专注于混合现实(MR)技术开发的 扶光工作室 这次带来了《气与魔法》多人对战游戏。玩家需要手持一根魔法棒对轰,击中对面对手的盾牌,被路过的现场观众强势围观。扶光的朋友们还贴心地为玩家保留了在这条走廊闪转腾挪的影像。

作为本次 Open Day 展区的唯一一家大模型厂商,面壁小钢炮 这次主要展示了 2 款轻量端侧模型。现场观众可以通过已本地部署模型的 iPad 与它们进行对话交互,尤其是借助摄像头感受实时视频理解能力。

声湃 x 罗德麦克风 联合展位既摆出了罗德的专业音频设备,也给大家带来了声湃的语音克隆 demo。现场直接售出了几台罗德展品,好的输入设备也能帮助提升这些围绕音视频交互的产品体验,尤其是在较为嘈杂的环境中。

inSpaze 是一款专为 Apple Vision Pro 设计的社交应用,戴上 Apple Vision Pro 除了能与其他线上朋友社交互动,还可以在自己的 “房间” 听歌、玩游戏、360 度欣赏模型等等。只要你不是近视眼,相信你的感觉一定很棒。社区小伙伴体验完之后也大呼心动,甚至开始憧憬社区将来的 Meetup 也能在 inSpaze 上举办。

本次 RTE 年度场景 Showcase 的重点生态合作与社区伙伴伯克利天台基金、五源资本、Rokid、inSpaze、真成投资、大创智、AWS 云创、 Founder Park、HuggingFace、LlamaIndex 等等也专程在 showcase 路演前后,在 RTE Open Day 展区打卡体验。

为了让不在现场的朋友也能感受一下氛围,这次 Open Day 特别安排了展区 live tour 直播,并且随机对一些展商进行了采访。

而超音速吉祥物、社区大明星 小音符獭獭 这次装备升级,戴上了专属的 RTE 口水巾。我们的獭獭周边越来越多,以后 RTE 开发者社区,还请认准獭獭帽子!

线下游园环节,夸夸贴纸上次备受好评,以后也会成为我们的保留项目。喜欢哪个项目,就要把自己的夸赞传达出去!

同时这次 RTE Open Day 还推出线上线下联动,进行网站评论抽奖,希望将展商项目跟现场观众的连接延续到线上。

“这也太酷了”“体验非常丝滑”“产品快点正式上线”,现场观众留下这样的反馈,进入产品的用户社群,或者是与展商沟通业务合作。2 天 Open Day 展商市集结束,虽然大家身体很疲惫,但是收获颇丰!

最终结合我们的线下夸夸贴纸数量,和线上网站的留言与点赞数,PixelHack 获得了我们本次最受欢迎的展商大奖,“你就是 RTE 行业的未来!”

🎙️ 围观《编码人声》的线下开放麦

面向开发者,聊聊技术和人生,由 RTE 开发者社区出品的《编码人声》已经走到第四年,屡次获得苹果播客首页推荐和年度科技播客提名,单期收听量 10 万 +。

这一次我们把录制现场放到了 RTE 大会线下。四场嘉宾和话题的轮番上阵,听众或专程或意外的加入,这一切都组成了一场技术思辨的流动的盛宴。

四场录制覆盖话题:AI 写作和 AI 播客、Computer Use 和 Action Agent、空间计算和物理计算和 RTE 场景年度大盘点。也欢迎关注《编码人声》播客订阅接下去的更新。

🤝 来 Dev Party 认识新朋友

Dev Party@RTE Open Day 是我们为社区开发者准备的固定的环节,在第一天的灵感和技术交流后,总需要换一个轻松氛围认识新朋友、分享新想法。

开场的是社区发起人 Cynthia 和主理人杜金房、Richard 林旅强,而近期加入 RTE 开发者社区的主理人卢恒老师最后也赶到现场,第一次全部线下集合啦!

Dev Party 通常没有什么特定的主题,吃饱喝足之后最重要的就是 lightning demo 环节,鼓励开发者 即兴、快闪式地聊聊 自己最近的项目或者想法,只有 3 分钟,不需要 PPT。阶跃星辰、弥知科技 AR 平台、WasmEdge、TEN Framework、言灵计划&Paw Party、姬械机和声网的伙伴们依次上前分享。

💻 Workshop 动手实操多模态

这次 Open Day 为 T08 展位的 TEN Framework 专门安排了一场线下工作坊,希望现场开发者在体验完展区的实时互动项目之后,也可以尝试使用实时多模态开源框架来构建自己的 AI Agent。

三场开场分享,先为开发者启发一些灵感。普列斯作为 TEN Framework 共同发起者 & RTE 开发者社区布道师,介绍了 TEN 开源框架为构建实时多模态 AI Agent 时所提供的一些解决方案,以及最佳实践案例。

第二位讲师吕翔,是来自阿里巴巴通义实验室的语音算法专家,分享了 CosyVoice 语音生成大模型原理和实践。CosyVoice 是 TEN Framework 的插件生态中的一个代表。这次工作坊的升级挑战中,我们也给大家准备了 CosyVoice 和 FishAudio 的 key,让大家现场体验不同的 TTS 效果。

Rokid 全球开发者生态负责人赵维奇,最后介绍了 Rokid 空间计算,以及如何利用 TEN Framework 结合 Rokid 穿戴硬件开发实时多模态 Agent 应用。

动手实践环节,其实 3 个小时并不久。这次工作坊为大家准备了三个挑战,从跑通基础 Agent demo,体验 OpenAI realtime API 到自行修改 Agent 相关配置,循序渐进尝试 TEN 接入的不同能力。现场有超过一半的朋友拿走了我们的挑战成功礼品,还在结束后成为了 TEN 社群的新晋成员。也特别感谢社群伙伴喵喵在现场协助 TEN 主创团队为大家提供技术支援。

💥 在技术论坛碰撞观点

本次大会的 5 场技术论坛,信息量满满,无法在这篇 recap 内一一展现,请关注 RTE 开发者公号后续的单篇分享回顾!

🎉 见证 RTE 年度最具代表性场景三强出炉

10 月 25 日下午,RTE 年度场景 Showcase 暨第四届 RTE 创新大赛在 RTE 生态与社区伙伴们的见证下圆满完成,2024 年春季超音速计划四强与 RTE 开发者社区及各国际赛区的优胜项目共同角逐年度最具代表性场景三强,通过激烈的角逐最终评选出三强团队:Infiniflow、聊会小天和 Traini。由观众现场投票选出的最受观众欢迎奖 PixelHack 获得了 AIRTE 版的小音符獭獭。

https://mp.weixin.qq.com/s/2ieRuPMT492UUZvbYEvc9Q

当一群人聚在 RTE Open Day 现场,就会有新的灵感和机会出现!

那么,今年的 Open Day 就到此全部结束!明年还会有什么新鲜的项目和玩法呢?跟大家一起期待着!

点击👇图片下方链接查看过往 RTE Open Day

https://mp.weixin.qq.com/s/RoA0k5jvb4b3zlVYsoDcBA

点击👇图片下方链接查看过往 RTE Open Day

https://mp.weixin.qq.com/s/WOtQV1EI9I8akXCY53nR_g

RTE 开发者社区介绍

RTE 开发者社区由声网及多位资深实时互动社区专家联合发起,是聚焦实时互动领域的中立开发者社区。希望通过社区链接领域内的生态伙伴,激活开发者力量,萌芽更多新技术、新场景,探索实时互动领域的更多可能。

RTE 开发者社区有一系列的线上线下活动平台,包括平均单期播放 10 万人次的播客《编码人声》、每月举办的 RTE Meetup 以及周期性的 RTE Open Day,为各类 RTE 开发者提供了交流、展示 demo、合作握手的平台,可以关注我们的公众号 “RTE 开发者社区” 了解最新动态与活动信息哦!

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册