2024年10月25日~26 日,由声网和 RTE 开发者社区联合主办的 RTE2024 第十届实时互联网大会 将在北京·悠唐皇冠假日酒店正式开启!
大会以「AI 爱」为主题,推出覆盖实时互联网全生态的论坛及周边活动共计 20 余场。
RTE Open Day 携手 18 家展区伙伴齐聚大会现场,等候实时互动领域的开发者们前来体验、交流!
这次 Open Day, 除了多家互动体验强、探索前沿 RTE+AI 场景的展商,还会带来一场 RTE 2024 Workshop,与 builders 一起动手构建实时多模态 AI Agent。更别忘了游园打卡,领取礼品🎁!
如果有兴趣一起共建活动,也欢迎成为社区志愿者。
⏰ 10 月 25 日-26 日(周五、六)
📍场地:北京悠唐皇冠假日酒店 F6 层
🗺️ 地址:北京市朝阳区三丰北里 3 号
🙋🏻 大会参与方式:扫描海报二维码限时获取免费门票
👇等不及的朋友可以先报名,再看具体指南👇
翻阅这篇指南,将 RTE2024 Workshop、RTE Open Day 展区、技术论坛、创赛决赛、Dev Party 的精彩内容打包收下。也请一并收下 RTE Open Day 展区玩法,拿走我们准备的各种社区好礼 🎁!
OpenAI Realtime API 发布,语音 AI 将迎来新一次爆发。AI 的实时语音和视觉互动能力将为我们带来多少新的创意和场景?现在,让我们快速动手去体验,并实现一种想法。
在这场工作坊,你会接触到平台型开源框架 TEN Framework,以及使用 TEN 开发的多模态实时互动 AI Agent — TEN Agent,并尝试自定义一个实时多模态 Agent。
与此同时,来自 CosyVoice、Rokid 的开发者导师,也会分享在语音生成模型、空间计算在 Agent 搭建的原理和实践。启发你更多想象。
TEN 是市面上第一个兼容了 OpenAI Realtime API 和 RTC 的实时多模态 AI Agent 框架,现在访问https://agent.theten.ai可以立刻体验接入 Realtime API beta 的最新版本 TEN Agent!
无需撰写代码,你就能创建多模态 Agent。当电脑响起 “Voice Agent connected!”,你将亲身体验到 AI Agent 的实时对话能力,TEN Agent 能够立即响应你的语音指令,基于视频进行图像理解,并且还能进行网页和天气检索,让你感受到更自然的人机互动体验。
如果你还有口语陪练、儿童故事会、旅游助手等想法,不妨在 TEN 框架下进行自定义,为你的 Agent 赋予新的人设(persona)、音色和功能,即刻探索语音、视频交互的新场景!
现场会设置双重挑战,无论你是想体验多模态 Agent 抑或尝试自己的想法,这里都有适合你的内容。来自 TEN Framework 团队的技术导师们都会在现场为大家答疑。达成基础挑战的伙伴都能拿走我们的开发者奖品,完成进阶挑战更有好礼相赠!
即刻扫码报名!仅有三十余席位!报名需审核,名额满员即截止报名。
*本 Workshop 门票包含:开发者伴手礼包、当日活动下午茶、大会千人高峰论坛及分论坛免费参与、展区参观体验、大会资料下载。
在 RTE Open Day 展区,身临其境地「触摸」、「聆听」、「交互」实时互动前沿技术,与产品背后风采各异的开发者和创业者一对一交流。这次参与的 17 家展商,包含了 AI Agent 框架、AI 情感陪伴、AI 翻译、AI 游戏、虚拟空间、Voice AI 等众多 RTE+AI 场景,欢迎大家深度游玩体验。
后面还有今年的展区玩法和礼品噢!
RTE 开发者社区
RTE 开发者社区是聚焦实时互动领域的开发者社区。希望通过社区链接领域内的开发者和生态力量,萌芽更多新技术、新场景,探索实时互动领域的更多可能。这里你将遇见一群致力于改变人和人、人和世界,以及人和 AI 连接方式的开发者。
TEN Framework-首个兼容了 OpenAI Realtime API 和 RTC 的实时多模态 AI Agent 框架
多模态 agent # 实时 AI
TEN (Transformative Extensions Network) Framework 是一个平台型开源框架,能够让开发者一站式快速、灵活地搭建属于自己的多模态实时互动 AI Agent,这个框架包括了基于 Rust 语言开发的 all-in-one TEN manager,支持实时互动的多模态标准协议,支持多种编程语言混合使用的 TEN Runtime,用于可视化低代码编排逻辑的 Graph Designer,以及支持社区公开发布、分享的 Extension Store,供开发者在构建 AI Agent 的过程中即插即用地挑选心仪的模块灵活替换。
超梦 AI - 超越现实 梦伴相随
# 情感计算 #AI 陪伴
超梦品牌创建于 2024 年,其母公司超次元 10 年来勇立潮头,曾引领 AR 收藏卡牌,AI 数字人、元宇宙等多个风口行业的商业化创新。超梦 AI 专注于 AI 情感陪伴领域的商业化探索,目前已上线的产品有《心动日记 X》,《超梦 AI》也即将重磅推出,超梦 AI 是集真人拍摄 +AIGC 拟真 + AIGC 二次元等多型态自定义角色 + 多模态场景交互建立起来的 AI 陪伴社区,可满足用户多样化情感陪伴。再立潮头,超梦 AI 蓄势待发。
Felo 实时翻译
# 实时翻译 #AI 出海
Felo 实时翻译是一款利用 GPT 翻译功能的工具。使用首创 RRT(Real-time ReWrite Translate)技术,先快速直译,再结合上下文深度翻译,可使实时翻译和同声传译比以往更快、更高效。无论是国际旅行、跨境商务交流,还是单纯的外语学习,Felo 实时翻译都是您的理想工具。还支持所有的客户端(iOS,Android,Mac,Windows)。
Gotin - 虚拟体验和智能营销管理一站式平台
#multi-player # 实时 3D
有大科技致力于建设国际领先的虚拟空间及体验综合服务平台,打造未来虚拟交互的新方式,为全球品牌方及组织机构提供虚拟空间一站式解决方案。依托于自研 AI 算法和 WebGL 3D 引擎,融合虚拟人、数字资产等技术,帮助客户搭建沉浸式品牌空间,运营高互动性的在线营销活动,沉淀高活跃度的品牌社区。真正为品牌方提供从策划到运营的一体化落地方案。有大科技已服务数百家知名企业、组织,包括联合国、GSMA、保时捷、友邦保险、字节跳动等,成为科技、汽车、金融、奢侈品等行业品牌值得信赖的虚拟营销伙伴。
XSwitch - 做最好的实时音视频和 AI 连接器
# 多模态 agent # 实时音视频
XSwitch 是一个实时多媒体软交换系统和连接器,致力于连接一切音视频、AI 设备和服务,包括但不限于 PSTN、SIP、WebRTC、和各种 GPT。
言灵计划- Your game, redefined
#multi-player # 互动娱乐
《言灵计划:中二嘴炮大作战》是一款由 AI 驱动的演出派对游戏。召唤师通过玩梗召唤独一无二的神奇生物 “言灵”,让他们进行荒诞且热血有趣的嘴(hu)炮(xiang)战(tu)斗(cao)。和你的朋友一起,进行充满着想象力和创意的对决吧!
Emerge
# 数字艺术 # 实时互动
自 2017 年成立以来,EMERGE 一直致力于创造美好而又能被感知的体验。践行独特的理念和方法论,为诸多品牌创作和制造了有趣而又奇妙的互动内容。用更可感知的技术,让故事、知识走进了企业、公共空间、展场、峰会、校园。
萤火空间混合现实(MR)人机协同平台 - 世界顶尖混合现实技术 + 优秀自研软硬件
# 空间计算 # 混合现实
苏州萤火空间科技有限公司成立于 2017 年,专注于混合现实企业级软硬件产品的研发以及开发。目前拥有数项世界领先技术,包括全球最大的光学透视视场角光学方案、国际顶尖的 3D 实时扫描建模技术、电池热插拔技术以及混合现实一体机技术等。公司同时独立研发了 MR 远程协作以及 MR 无代码编辑器两款标准化软件,可供企业快速部署和使用,目前已经在国家电网、工厂、设备供应商等多个领域有销售和落地案例。
Viitor AI - 利用我们的人工智能平台彻底变革您的内容
#Voice AI # 实时翻译
ViiTor AI 提供高质量的视频翻译、音色克隆、AI 虚拟形象视频、语音合成、音色库等产品服务,为您的创作全方位赋能;同时还支持实时翻译功能,19 种语言互译,为您提供无障碍交流服务。
PixelHack - 进入儿时街机世界,与好友一起大战像素世界!
#multi-player # 互动娱乐
《PixelHack》是一款 XR 射击游戏,通过 RTE 实现多人实时在线作战,玩家们可以在同一地方实时看到其他玩家的位置动作,通过语音互相沟通。游戏是复古像素画风,给人一种回到小时候打街机的感觉。
FishAudio - 实时、定制化、情感丰富的下一代语音合成技术
#Voice AI # 情感计算
Fish Speech 是 Fish Audio 团队自主研发的语音合成大模型,通过上传音频或使用线上音频生成如原声般自然的音频。基于团队对模型的设计与 70 万小时的数据训练 (截至目前),各项能力均领先于行业。我们深知开源对技术发展的重要性,在 Github 上已开源,模型框架简单易用、延迟低至 200-400ms(含网络)、效率高,通过上传 15 秒的参考音频快速克隆出音色/语调/韵律/情感,表达不同语种下的内容。随意的音频片段或是专业的配音片段,模型都会展现其原本声色。
MicroBlocks - 为「物理计算」而生的图形化编程语言
# 物理计算 # 实时编程
使用 MicroBlocks 实时编程工具制作的互动空间。包括可以语音互动的机器狗,动态生成的 MIDI 节奏,一起跳舞的小车。
蚁触科技 - 用触觉赋能数字世界,让每个用户感受到真实
# 触觉 AI # 实时 AI
蚁触科技触觉 AI 解决方案以自研算法 ANTHAP.AI 为核心,该算法能够适配多智能终端、兼容多系统并跨平台运行,为音乐、视频、游戏等内容实时渲染细腻逼真的触觉效果。我们率先将方案应用于品牌数字营销场景和车内空间,软硬件产品均已量产并成为多个行业头部客户的认可。
扶光工作室 (TouchLight Studio) - Dance with Light
#multi-player # 混合现实
扶光工作室专注于 MR(混合现实)技术开发,致力于为线下娱乐提供创新的多玩家互动体验。我们以轻量化设备和自研技术为基础,打造例如《气与魔法》这样的多人混合现实对战游戏,融合虚实,让玩家在现实世界中感受魔法对战的乐趣。我们的解决方案灵活适用于商业地产、展览等场景,推动虚拟与现实娱乐的结合,满足人们不断升级的娱乐需求,让更多人体验混合现实的独特魅力。
面壁「小钢炮」MiniCPM - 旗舰端侧大模型
# 实时多模式 # 边缘计算
面壁「小钢炮」MiniCPM 端侧模型系列
全球领先的轻量高性能大模型。包含基座模型 MiniCPM 和多模态模型 MiniCPM-V。自发布以来,以其「以小博大」的性能和卓越端侧表现,受到世界开源社区的广泛赞誉,当前下载量已超 100 万。
旗舰端侧基座模型 MiniCPM
MiniCPM 基座系列以仅 2B 的参数规模,超越 7B 甚至更大量级模型性能,追求极致高效率、低成本,支持消费级显卡微调。
旗舰端侧多模态模型 MiniCPM-V
开启端侧全面对标超越 GPT-4V 新时代。实现单图,多图,实时视频全维度 3SOTA。多项功能,首次上端!
声湃 x 罗德麦克风 - 让您的声音如专业主播般动听
#Voice AI # 音频硬件
罗德麦克风,作为全球知名的音频设备厂商,专注于提供高端的声音采集与录制解决方案。旗下的产品搭载了先进的硬件 AI,能够自动提升您的音质体验。而作为国内最大的第三方播客内容服务平台,声湃与罗德麦克风携手,在超过 20,000 小时的中文播客内容训练的基础上,为播客创作提供专门训练的 TTS 服务和模型,确保您的表达方式更贴近专业主播的风格。
inSpaze - 社交,从未如此真实
#multi-player # 空间计算
inSpaze 是一款专为 Apple Vision Pro 设计的全新社交应用,旨在利用 Apple Vision Pro 的空间计算能力为全球用户提供全新的沉浸式社交体验。在 inSpaze 中,你可以结识其他 Apple Vision Pro 的用户,空间音频、persona 和实时语音翻译等功能为你提供无与伦比的临场感,感觉就像正在和人面对面交谈。可以在 “派对” 上玩游戏、分享空间照片和视频,甚至与他人分享您的 3D 模型。
大会盖章打卡【大会服务台处抽奖】
1、全场共 32 个大会打卡点,RTE Open Day 的所有 18 家展位都参与其中,欢迎找我们打卡集章。
2、T01-「RTE 开发者社区」、T08-「TEN Framework」、T10-「Viitor AI」、T18-「inSpaze」是本次大会「必打卡点」,「必打卡点」全部集齐有机会抽取大会特等奖!
Open Day 展区打卡【T01 社区展位领奖】
1、注册网站有礼
扫码注册「RTE 开发者社区网站」https://www.rtecommunity.dev/,线下即有 RTE Open Day 定制主题拼图 + 社区充电线相送!
2、扫码入群有礼
到时现场扫码入「RTE Open Day 现场观众群」,获取 Open Day 展区专属 「夸夸贴纸」 ,为你喜欢的项目👍
后续还会在群里发起精彩评论有礼活动!
3、精彩评论有礼
登录「RTE 开发者社区网站」,在本次展区你喜欢的项目页面留言、点赞,25、26 日晚上我们都会选出至少 3 个精彩评送出价值 150~200 元左右的礼品,超音速定制键盘、超音速定制护照夹、围炉煮茶套装、社区帽衫等等!
还有一个终极评论奖,我们将送出一只价值 400 元的定制版超音速吉祥物獭獭!
结合线下的「夸夸贴纸」数量和线上的「留言点赞」,我们会从展商中评选出一个 「你就是 RTE 行业的未来」 奖,并送出一台 PS5,请大家发散自己的好评吧!
p.s. 1 个线上评论=5 个线下「夸夸贴纸」点赞=5 个线上点赞
线上评论/点赞截止时间:10 月 27 日 23:59 开奖时间:10 月 28 日
点击论坛图片,了解嘉宾和议题。
https://mp.weixin.qq.com/s/Sd2Pnu34B2P8Gb72zgvwrg
https://mp.weixin.qq.com/s/zI6sWxvLJyc3-3Cz3Lx2HA
https://mp.weixin.qq.com/s/7YE4NS6ve3ZNEEbwDc07rQ
https://mp.weixin.qq.com/s/w-hUvdXtnL1fhtl9UAmiXA
https://mp.weixin.qq.com/s/AMoKfIW5Na2S_e0QzwvG1w
https://mp.weixin.qq.com/s/jUlkQy2BhC2Z4YFaFyRLpA
一天的灵感和技术交流后,来 Dev Party@RTE Open Day,换一个轻松氛围认识新朋友、分享你的新想法。
在 RTE2024 大会第一天(10 月 25 日)结束后,晚上在我们的开发者聚会享受轻松氛围、美食饮料,和一群实时互动 builder 交流技术与生活。
本活动为邀请制。
如果你对人和技术都怀有好奇心和善意,欢迎扫码成为 RTE Open Day 现场志愿者,与我们一起共建和成长。
报名志愿者
以上即本次 RTE Open Day@RTE2024 的完整指南!
请收好并报名,RTE Builders,我们北京见!
RTE 开发者社区由声网及多位资深实时互动社区专家联合发起,是聚焦实时互动领域的中立开发者社区。希望通过社区链接领域内的生态伙伴,激活开发者力量,萌芽更多新技术、新场景,探索实时互动领域的更多可能。
RTE 开发者社区有一系列的线上线下活动平台,包括平均单期播放 10 万人次的播客《编码人声》、每月举办的 RTE Meetup 以及周期性的 RTE Open Day,为各类 RTE 开发者提供了交流、展示 demo、合作握手的平台,可以关注我们的公众号 “RTE 开发者社区” 了解最新动态与活动信息哦!
超音速计划是 RTE(实时互动)赛道头部创业伙伴营,关注 RTE 领域新场景、新技术,赋能创业开发者更低成本、更高效地实现创新创业。超音速计划诚邀那些专注于实时音视频(RTE)新技术与新场景的初创企业参与申请。我们特别欢迎融资阶段处于 A 轮或 A 轮之前的企业,尤其是那些产品仍处于初级阶段,并且深刻认同 RTE 长期价值的创新团队。希望与您共同探索无限可能,推动行业的未来发展!如果还没有完整的项目,也欢迎先加入我们的 RTE 开发者社区哦~