首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#视频

DynamiCrafter: 利用扩散先验的开放域图片动画化

用户1324186

上海交通大学 · 研究员 (已认证)

VideoCrafter的网络架构如图所示,它包括T2V和I2V两个子任务,相应的需要注入Text prompt和image prompt。Motion spe...

300

CVPR 2023 | 高效视频超分辨率的结构化稀疏学习

用户1324186

上海交通大学 · 研究员 (已认证)

视频超分辨率(VSR)模型的高计算成本阻碍了它们在资源有限的设备上的部署,例如智能手机和无人机。现有的 VSR 模型包含大量冗余滤波器,影响了推理效率。为了修剪...

100

ggfittext | 这样绘制文本不要太简单了...

DataCharm

「PS」:我们直播教学内容为课堂式教学,原作者带着大家对书籍一章、一节、一页的进行教学。而且直播的视频都会通过剪辑后整理成课程,圈子中的同学可以免费、反复观看。...

200

打破视频标注成本壁垒,图像字幕引领文本到视频检索训练新趋势,超越零样本CLIP Baseline !

公众号-arXiv每日学术速递

近年来,自动视频理解的研究经历了多次范式转变。随着神经网络的兴起,最初的问题是如何设计一种架构来输入时空信号[49, 68]。鉴于有限的视频训练数据,焦点随后转...

700

智能创作时代:AI引领下的内容生产革命与效率提升

Srlua

随着人工智能技术的飞速发展,AI技术在内容生产、分发、分析与优化等方面的应用越来越广泛。本文将从大模型推荐、如何高效使用AI、自动化内容生成、内容分发与推广、内...

1400

让照片开口说话!基于音频生成动画 | 开源日报 No.253

小柒

SadTalker 是一个基于音频驱动的单幅图像对话头像动画生成项目。它可以将单幅人像图像与音频结合,生成逼真的视频对话头像。该项目的主要功能和核心优势包括:

2310

2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

苏生不惑

之前分享过我写的几个工具2023 更新版:苏生不惑开发过的那些原创工具和脚本 ,今天再更新下微博下载。

3900

刀具补偿是怎么回事?

lrglu

数控编程、车铣复合、普车加工、Mastercam、行业前沿、机械视频,生产工艺、加工中心、模具、数控等前沿资讯在这里等你哦

2900

UniFormer v2改进升级 | CUENet优化SA注意力,用高效加性注意力机制,加速Transformer落地!

集智书童公众号

根据世界银行的数据,过去五年全局犯罪率有所上升。监控摄像头通常被部署以帮助威慑暴力,提供实时监控并收集犯罪或暴力活动的证据。得益于技术的进步,监控系统越来越经济...

4600

HLS视频加密,让您的视频内容更安全!

云存储

腾讯云 · 云存储 (已认证)

HLS视频加密是一种基于HTTP Live Streaming(HLS)协议的加密技术。它的核心思想是将视频切片进行加密处理,在客户端播放时需要先获取解密密钥才...

4910

苹果M4处理器跑分曝光:多核成绩接近15000分

芯智讯

5月9日消息,苹果近日正式发布了新一代的iPad Air与iPad Pro机型。其中,新的iPad Pro则是采用了OLED面板,并且直接跳过了M3处理器,直接...

6810

2030年全球AI数据中心的电力需求量将增长160%

芯智讯

根据市场调研机构Factorial Funds的报告显示,OpenAI的文字生成视频模型Sora一个月内使用4,200至10,500片H100 GPU,其中单个...

5810

RSAC 2024创新沙盒|Reality Defender:深度伪造检测平台

绿盟科技研究通讯

Reality Defender是2021年成立的一家专注于检测深度伪造(Deepfakes)和合成媒体(Synthetic Media)的初创公司,提供针对多...

8810

智谱AI正研发文生视频模型;苹果将用自研模型Ajax优化iOS 18;Q1全球云服务市场增长21%丨每日大事件

数据猿

5月6日消息,估值超200亿的国内AI大模型独角兽公司“智谱 AI”正在研发对标OpenAI Sora的高质量文生视频模型,预计最快年内发布。智谱AI内部人士表...

4910

卧槽,马赛克也能去掉了!

快学Python

DemoFusion 就是这么一个开源项目,继续深挖了 AI 绘画在高分辨率图片生成的效果。

9110

效率工具推荐(第43期)

产品的技术小课

腾讯科技 · 前端开发工程师 (已认证)

这是一个免费的全平台网站视频下载工具。我们有时候看到想要下载的视频,但是没有下载按钮怎么办?该平台就是为了解决这个痛点而生。

18220

【FFmpeg】音视频录制 ① ( 查询系统中 ffmpeg 可录制的音视频输入设备 | 使用 ffmpeg 命令录制音视频数据 | 录制视频数据命令 |录制音频数据| 同时录制音频和视频数据命令 )

韩曙亮

在 Windows 系统中 , 使用 ffmpeg 命令 录制 音视频 , 需要先获取 系统的 音视频设备 信息 , 录制 音视频 本质上是从 系统音视频设备 ...

10310

ITU-R BT601/BT709 BT656/BT1120区别与联系

碎碎思

BT601是SDTV的数据结构 BT656是SDTV(1280x720P@60Hz)的interface PCLK+8bit Data

12610

h5是什么意思

老K博客

5 是 HTML5 的简称,是一种用于构建交互式 web 内容的标记语言和应用程序编程接口 (API)。它允许开发者使用更少的代码创建功能更强大的 web 体验...

6310

直接生成16秒高清视频 我国自研视频大模型Vidu在京发布

万猫学社

清华大学人工智能研究院副院长、生数科技首席科学家朱军说,目前国内的视频大模型生成的视频时长大多为4秒左右,而Vidu则能够一次性生成长达16秒的视频。他还强调,...

9310
领券