掌握聚合最新动态了解行业最新趋势
API接口,开发服务,免费咨询服务

Adobe 展示 Project VoCo:像编辑文本一样编辑语音

Adobe 在 MAX 大会的一场发布会上演示了 Project VoCo。这一工具并非基于传统的语音合成技术,其技术被 Adobe 称作“语音转换”。尤其有趣的是,这里几乎完全不需要人工干预。用户可以更正自动生成的内容,从而优化合成技术。此外,用户完全没有必要设定时间戳,算法将自动确定时间。

这项技术带来了多方面问题。如果语音记录无法再被信任,那么将会发生什么?但从纯技术的角度来看,这款产品给人留下了深刻印象。

在同一场发布会上,Adobe 还展示了两款新的编辑工具:帮助用户更方便编辑打印图层的 Project Quicke Layout,以及虚拟现实编辑工具 Project Clover。

对于这些试验项目,Adobe 并未承诺将最终推向普通用户。不过过去多年中,该公司以这种方式启动的多个项目最终都成为了产品。

436-projectvoco6.jpg.jpg

原文来自:TechCrunch 中国

声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com

  • 人脸实名认证2.0

    通过身份证号+姓名+人脸照片的一致性比对,系统与公安库中的身份证登记照比对,判断是否为同一人,核验用户信息真实性。

    通过身份证号+姓名+人脸照片的一致性比对,系统与公安库中的身份证登记照比对,判断是否为同一人,核验用户信息真实性。

  • IPv6地址

    根据查询的IPv6地址,查询该IPv6所属的区域,城市级查询。

    根据查询的IPv6地址,查询该IPv6所属的区域,城市级查询。

  • 2026美加墨世界杯

    2026美加墨世界杯小组赛、1/16决赛、1/8决赛、1/4决赛、半决赛、季军赛、决赛赛程及积分榜

    2026美加墨世界杯小组赛、1/16决赛、1/8决赛、1/4决赛、半决赛、季军赛、决赛赛程及积分榜

  • AI语音合成TTS API

    提供多种拟人音色,支持多语言及方言,并可在同一音色下输出多语言内容。系统可自适应语气,流畅处理复杂文本。

    提供多种拟人音色,支持多语言及方言,并可在同一音色下输出多语言内容。系统可自适应语气,流畅处理复杂文本。

  • Google Gemini Image API

    Nano Banana(gemini-2.5-flash-image 和 gemini-3-pro-image-preview图像模型)是图像生成与编辑的最佳选择,可集成 Nano Banana API,实现高速预览。

    Nano Banana(gemini-2.5-flash-image 和 gemini-3-pro-image-preview图像模型)是图像生成与编辑的最佳选择,可集成 Nano Banana API,实现高速预览。

0512-88869195
客服微信二维码

微信扫码,咨询客服

数 据 驱 动 未 来
Data Drives The Future