介绍: 互联网图片库来自sogou图片搜索所索引的部分数据。其中收集了包括人物、动物、建筑、机械、风景、运动等类别,总数高达2,836,535张图片。对于每张图片,数据集中给出了图片的原图、缩略图、所在网页以及所在网页中的相关文本。 格式说明: 共包括四个文件:Meta_Data, Original_Pic, Pages, Zoomed_Pic。其中Meta_Data存储图片的相关元数据:Original_Pic中存储图片的原图;Pages中存储图片所在的页面;Zoomed_Pic中存储所有图片的缩略图,缩略图大小为130*130左右。 Meta_Data文件包含所有图片的相关元数据,格式如下: 图片在互联网中的URL地址 图片所在网页的URL地址 图片的替换文字 以图片为目标的超链接的显示文本 页面中提取的图片周围的文本 图片所在页面的标题 图片的宽度 图片的高度 相关任务: 基于文本/内容的图片检索 相关资源: 互联网语料库 下载: 下载前请仔细阅读“搜狗实验室数据使用许可协议” Please read the "License for Use of Sogou Lab Data" carefully before downloading. 完整版(269GB):(硬盘拷贝) 反馈: 在线上反馈留下您的宝贵意见和建议。 在资源下载FAQ中查找您遇到的资源下载问题的答案