AI社区

热门板块
热门话题

人工智能模型社区 1个主题内容

ChatGPT注册使用 0个主题内容

算力百科 0个主题内容

bug及解决办法 0个主题内容

数据集应用社区 7个主题内容

AI大学 2个主题内容

应用案例：双目作为3D相机，仿照人类双眼感知世界

卷积神经网络（Convolutional Neural Networks）

BP(back propagation)神经网络

SOM 自组织映射神经网络

独立同分布（iid，independently identically distribution）

层次聚类算法

Mean Squared Error 均方误差

致AI开发者的公开信

今日排行

30条结果语言模型
2条结果函数
71条结果大模型
3条结果GPT
4条结果提示
2条结果语音
3条结果模态
5条结果数据集

本月搜索

2条结果函数
71条结果大模型
30条结果语言模型
3条结果GPT
40条结果语言
5条结果数据集
2条结果语音
3条结果模态

首饰数据集
项饰数据集
腕饰数据集
戒指/指环数据集
耳饰数据集
胸针数据集
手把件数据集
头饰数据集
串珠配珠数据集

水果数据集
核果类数据集
仁果类数据集
浆果类数据集
柑果类数据集
瓠果类数据集
其它类数据集

坚果数据集

大模型

AudioLDM:具有潜在扩散模型的文本到音频生成 2023-08-09 14:28:33
StoryBench: 一个多方面的连续故事可视化基准测试。 2023-08-24 00:25:22
深入探究单目三维物体跟踪的运动感知匹配技术 2023-08-24 00:16:12
GRIP: 利用潜在一致性和空间线索生成交互姿势 2023-08-24 00:06:12
基于分层变形的少样本物理感知关节网格生成 2023-08-23 09:31:08
从人类视频中构建结构化世界模型 2023-08-23 09:24:20
CamP: 神经辐射场的相机预处理 2023-08-23 09:23:03
自适应阈值启发式算法用于KPI异常检测 2023-08-23 09:18:22
大型语言模型在电信行业的即将到来的影响 2023-08-18 01:19:04
共享用户嵌入的跨属性矩阵分解模型 2023-08-18 01:17:02
魔鬼在于错误：利用大型语言模型进行细粒度机器翻译评估 2023-08-18 01:15:37

Henry G. 3 minutes ago
StoryBench: 一个多方面的连续故事可视化基准测试。 2023-08-24 00:25:22
深入探究单目三维物体跟踪的运动感知匹配技术 2023-08-24 00:16:12
GRIP: 利用潜在一致性和空间线索生成交互姿势 2023-08-24 00:06:12
基于分层变形的少样本物理感知关节网格生成 2023-08-23 09:31:08
从人类视频中构建结构化世界模型 2023-08-23 09:24:20
CamP: 神经辐射场的相机预处理 2023-08-23 09:23:03
自适应阈值启发式算法用于KPI异常检测 2023-08-23 09:18:22
大型语言模型在电信行业的即将到来的影响 2023-08-18 01:19:04
共享用户嵌入的跨属性矩阵分解模型 2023-08-18 01:17:02
魔鬼在于错误：利用大型语言模型进行细粒度机器翻译评估 2023-08-18 01:15:37

AudioLDM:具有潜在扩散模型的文本到音频生成

Haohe Liu,Zehua Chen,Yi Yuan,Xinhao Mei,Xubo Liu,Danilo Mandic,Wenwu Wang,Mark D. Plumbley

文本到声音系统近年来受到了关注，然而，以前的音频系统研究有过有限的生成质量和计算成本。本文中，我们提出了一种基于潜在空间的音频编码器，以学习从对比语言语音预训练(CLAP)假设中学习不断演奏的声音的连续声音表示。预训练的CLAP模型使我们能够与使用视频编码进行培训时提供...

论文地址：https://arxiv.org/pdf/2301.12503.pdf

用户分享观点：