一、 格式说明
1) 字段说明
【组图格式说明】 | 选项 | 所有字段名必须要保留,即使此项信息值为空,字段仍然保留 |
通行约定 | 必选 | <?xml version=”1.0″ encoding=”utf-8″ ?> |
<document> | 必选 | 根标签,xml文件起始结束标签 |
<item> | 必选 | 图片信息起始结束标签,<document>下可以存在多个<item> |
整体字段信息 | 接入数据为结构化数据,即对一个主题(Query)的图,分不同的标签,每个标签下再有一组图片。 | |
<query_item> | 必须 | 匹配中的Query,能接入哪些Query可通过Query查询平台进行查询。 |
TAG字段信息 | ||
<tag_item> | 必须 | 接入数据中一个TAG数据组的开始 |
<tag_name> | 必须 | 标签的名称,对于一个Query接入的数据,某些标签是必须包含的。这些信息可以通过Query查询平台进行查询。 |
<referer> | 可选 | 抓取所需的referer;默认无referer。 |
<tag_op> | 可选 | add增加;update为更新,在tag内有效;默认为add。 |
TAG下的单图字段信息 | ||
<pic_item> | 必选 | 一个TAG下单图数据开始 |
<pic_id> | 可选 | 单图的位置顺序,建议为:1、2、3等 |
<pic_url> | 必选 | 图片url,不能为空 |
<pic_from_url> | 必选 | 单图网页url,不能为空 |
<pic_title> | 必选 | 单图标题,不能为空 |
<pic_desc> | 必选 | 单图描述,可以为空 |
备注 | <![CDATA[文本内容]]>:若此项无文本内容,则为空格,应用范围:所有含中文的字段 url字段其它英文、数字不使用 | |
单个XML格式不超过100组Query, 单个文件不超过10M |
2) XML格式示例
<?xml version=”1.0″ encoding=”utf-8″ ?>
<document>
<item>
<query_item><![CDATA[奥迪a4]]></query_item>
<tag_item>
<tag_name><![CDATA[整体外观]]></tag_name>
<referer>car.autohome.com.cn</referer>
<tag_op>add</tag_op>
<pic_item>
<pic_id>1</pic_id>
<pic_url> <![CDATA[http://car0.autoimg.cn/upload/2014/6/18/u_201406180007152484971.jpg]]> </pic_url>
<pic_from_url> <![CDATA[http://car.autohome.com.cn/photo/18320/1/2519508.html]]> </pic_from_url>
<pic_title> <![CDATA[奥迪A4(进口) 2014款 40 TFSI allroad quattro plus版]]> </pic_title>
<pic_desc> <![CDATA[ ]]> </pic_desc>
</pic_item>
<pic_item>
<pic_id>2</pic_id>
<pic_url> <![CDATA[http://car0.autoimg.cn/upload/2014/6/18/u_201406180007152484971.jpg]]> </pic_url>
<pic_from_url> <![CDATA[http://car.autohome.com.cn/photo/18320/1/2519508.html]]> </pic_from_url>
<pic_title> <![CDATA[奥迪A4(进口) 2014款 40 TFSI allroad quattro plus版]]> </pic_title>
<pic_desc> <![CDATA[ ]]> </pic_desc>
</pic_item>
<pic_item>……</pic_item>
<pic_item>……</pic_item>
……
</tag_item>
<tag_item>
<tag_name><![CDATA[车厢座椅]]></tag_name>
……
</tag_item>
<tag_item>
<tag_name><![CDATA[中控方向盘]]></tag_name>
……
</tag_item>
</item>
<item>
<query_item><![CDATA[MM]]></query_item>
<tag_item>
<tag_name><![CDATA[清纯]]></tag_name>
……
</tag_item>
<tag_item>
<tag_name><![CDATA[性感]]></tag_name>
……
</tag_item>
<tag_item>
<tag_name><![CDATA[火辣]]></tag_name>
<referer>www.4493.com</referer>
……
</tag_item>
</item>
</document>
二、 收录说明
- 网站提交的图片尽量为频道比较成套,成系列的图片,这样浏览起来体验比较好,点击率高;另外图片的质量也尽量高一些,这样在排序的时候可以排在结果页的前面。
- 可提交的网站类型:门户网站、新闻站、专业图片站、图片收集分享站、美女站、壁纸站、图片综合交易站或素材站等含有大量高质量图片的网站;禁止提交的图片类型:色情图片、违禁品、低俗、广告倾向明显、水印与宣传LOGO明显、或涉及政治性敏感的话题等不适于公共传播的图片。
- 有盗链的网站请将来自:so.com、image.360.cn的访问,加入refer白名单,以确保不会触发图片防盗链规则,给用户良好搜索体验的同时,360图片搜索也将给贵站带去更多流量。
原创文章,作者:大壮同学,如若转载,请注明出处:https://www.lidazhuang.cn/seo/haosouspider/475.html