对于NAS用户搭建本地私人影视库、开发影视类服务、AI训练,都需要影视类的数据集。
除了国内用户常用的豆瓣电影外,还有一些比较知名的影视类垂直社区,包括:
TMDB:https://www.themoviedb.org/
NeoDB:https://neodb.social
Letterboxd:https://letterboxd.com/
Rotten Tomatoes:https://www.rottentomatoes.com/
Trakt:https://trakt.tv/
AllMovie:https://www.allmovie.com/
Box Office Mojo:https://www.boxofficemojo.com/
汇总一下影视类数据集,没必要重新发明轮子,重复调用相关网站API或爬虫爬取。
TMDB 124万电影元数据
https://t.me/alanalysisfocus/141
由此Telegram频道 ALA数据分析 分享的The Movie Database (TMDB)的数据集,数据包含从1888年的Roundhay Garden Scene(已知世界上最早的电影)一直到去年的几乎所有电影。共计124万6758部。
115 ed2k下载:ed2k://|file|[124万]TMDB电影元数据.7z|151973236|BB4E11E05C7313FAD388EF2EBA700AC0|/
TMDB本身提供了API接口:https://developer.themoviedb.org/docs
NeoDB.social 的实例数据集
https://github.com/neodb-social/catalog-dump
API:https://neodb.social/developer/
电影数据集 Moviedata-10M
1000万豆瓣电影/评论/名人/评分数据,只到2019年
MovieLens
https://grouplens.org/datasets/movielens/
32M影视评分数据
豆瓣影评数据集1000W
https://textdata.cn/blog/2024-04-16-douban-movie-1000w-ratings-comments-dataset/
Datasets of MusicBrainz/Tidal/Spotify,很全面的开源音乐数据集