Home
Dataset
Scone
Models
Trade
Club
paper
TagableDB
TagableDB
个人信息
账户详情
图像标注
数据集管理
安全设置
AI社区
热门板块
热门话题
人工智能模型社区
1个主题内容
ChatGPT注册使用
0个主题内容
算力百科
0个主题内容
bug及解决办法
0个主题内容
数据集应用社区
7个主题内容
AI大学
2个主题内容
应用案例:双目作为3D相机,仿照人类双眼感知世界
卷积神经网络(Convolutional Neural Networks)
BP(back propagation)神经网络
SOM 自组织映射神经网络
独立同分布(iid,independently identically distribution)
层次聚类算法
Mean Squared Error 均方误差
致AI开发者的公开信
今日排行
3条结果
机器人
4条结果
检测
2条结果
语音
30条结果
语言模型
71条结果
大模型
40条结果
语言
4条结果
提示
5条结果
数据集
本月搜索
3条结果
机器人
4条结果
检测
3条结果
模态
40条结果
语言
2条结果
语音
5条结果
数据集
71条结果
大模型
30条结果
语言模型
箱包数据集
单肩包数据集
斜挎包数据集
手提包数据集
公文包数据集
双肩包数据集
钱包数据集
手拿包数据集
拉杆箱数据集
旅行包数据集
腰包数据集
鞋数据集
女鞋数据集
男鞋数据集
腕表数据集
劳力士数据集
欧米茄数据集
卡地亚数据集
万国数据集
西铁城数据集
浪琴数据集
美度数据集
汉米尔顿数据集
天梭数据集
梅花数据集
首饰数据集
项饰数据集
腕饰数据集
戒指/指环数据集
耳饰数据集
胸针数据集
手把件数据集
头饰数据集
串珠配珠数据集
水果数据集
核果类数据集
仁果类数据集
浆果类数据集
柑果类数据集
瓠果类数据集
其它类数据集
坚果数据集
干制坚果(种子)类数据集
干制果实类数据集
干制果肉类数据集
干制种仁类数据集
大模型
去分享一篇
SpeechX:作为通用语音转换器的神经编解码器语言模型
2023-08-15 23:36:09
StoryBench: 一个多方面的连续故事可视化基准测试。
2023-08-24 00:25:22
深入探究单目三维物体跟踪的运动感知匹配技术
2023-08-24 00:16:12
GRIP: 利用潜在一致性和空间线索生成交互姿势
2023-08-24 00:06:12
基于分层变形的少样本物理感知关节网格生成
2023-08-23 09:31:08
从人类视频中构建结构化世界模型
2023-08-23 09:24:20
CamP: 神经辐射场的相机预处理
2023-08-23 09:23:03
自适应阈值启发式算法用于KPI异常检测
2023-08-23 09:18:22
大型语言模型在电信行业的即将到来的影响
2023-08-18 01:19:04
共享用户嵌入的跨属性矩阵分解模型
2023-08-18 01:17:02
魔鬼在于错误:利用大型语言模型进行细粒度机器翻译评估
2023-08-18 01:15:37
Messages
Henry G.
3 minutes ago
StoryBench: 一个多方面的连续故事可视化基准测试。
2023-08-24 00:25:22
深入探究单目三维物体跟踪的运动感知匹配技术
2023-08-24 00:16:12
GRIP: 利用潜在一致性和空间线索生成交互姿势
2023-08-24 00:06:12
基于分层变形的少样本物理感知关节网格生成
2023-08-23 09:31:08
从人类视频中构建结构化世界模型
2023-08-23 09:24:20
CamP: 神经辐射场的相机预处理
2023-08-23 09:23:03
自适应阈值启发式算法用于KPI异常检测
2023-08-23 09:18:22
大型语言模型在电信行业的即将到来的影响
2023-08-18 01:19:04
共享用户嵌入的跨属性矩阵分解模型
2023-08-18 01:17:02
魔鬼在于错误:利用大型语言模型进行细粒度机器翻译评估
2023-08-18 01:15:37
SpeechX:作为通用语音转换器的神经编解码器语言模型
Xiaofei Wang、Manthan Thakker、Zhuo Chen、Naoyuki Kanda、Sefik Emre Eskimez、Sanyuan Chen、Min Tang、Shujie Liu、Jinyu Li和Takuya Yoshioka
最近,基于音频文本提示的生成式语音模型的发展使得高质量的零样本文本到语音变得可能。然而,现有的模型在处理涉及输入语音转换和处理在恶劣声学条件下捕获的音频等多样化的音频文本语音生成任务方面仍存在局限性。本文介绍了SpeechX,这是一个多功能语音生成模型,能够进行零样...
论文地址:
https://arxiv.org/pdf/2308.06873.pdf
用户分享观点:
发表观点