# What Is Web Scraping?

The automated gathering of data from the internet is nearly as old as the internet itself. Although web scraping is not a new term, in years past the practice has been more commonly known as screen scraping, data mining, web harvesting, or similar variations. General consensus today seems to favor web scraping, so that is the term I use throughout the book, although I also refer to programs that specifically traverse multiple pages as web crawlers or refer to the web scraping programs themselves as bots.

In theory, web scraping is the practice of gathering data through any means other than a program interacting with an API (or, obviously, through a human using a web browser). This is most commonly accomplished by writing an automated program that queries a web server, requests data (usually in the form of HTML and other files that compose web pages), and then parses that data to extract needed information.

In practice, web scraping encompasses a wide variety of programming techniques and technologies, such as data analysis, natural language parsing, and information security. Because the scope of the field is so broad, this book covers the fundamental basics of web scraping and crawling in Part I and delves into advanced topics in Part II. I suggest that all readers carefully study the first part and delve into the more specific in the second part as needed.

# Your First Web Scraper

## Let's try the toy first

In [2]:
from urllib.request import urlopen
html = urlopen('https://feng.li/python/')
print(html.read())

b'<!DOCTYPE html>\n<html lang="en-US" class="no-js">\n  <head>\n    <meta charset="UTF-8">\n    <meta name="viewport" content="width=device-width, initial-scale=1">\n    <link rel="profile" href="http://gmpg.org/xfn/11">\n        <script>(function(html){html.className = html.className.replace(/\\bno-js\\b/,\'js\')})(document.documentElement);</script>\n<title>Python &#8211; Dr. Feng Li</title>\n<link rel=\'dns-prefetch\' href=\'//feng.li\' />\n<link rel=\'dns-prefetch\' href=\'//fonts.googleapis.com\' />\n<link rel=\'dns-prefetch\' href=\'//s.w.org\' />\n<link rel="alternate" type="application/rss+xml" title="Dr. Feng Li &raquo; Feed" href="https://feng.li/feed/" />\n<link rel="alternate" type="application/rss+xml" title="Dr. Feng Li &raquo; Comments Feed" href="https://feng.li/comments/feed/" />\n\t\t<script type="text/javascript">\n\t\t\twindow._wpemojiSettings = {"baseUrl":"https:\\/\\/s.w.org\\/images\\/core\\/emoji\\/2.4\\/72x72\\/","ext":".png","svgUrl":"https:\\/\\/s.w.org\\/ima

The above doesn’t look so great. Below is better.

In [3]:
from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen('https://feng.li/python/')
bs = BeautifulSoup(html.read(), 'html.parser')
print(bs)

<!DOCTYPE html>

<html class="no-js" lang="en-US">
<head>
<meta charset="utf-8"/>
<meta content="width=device-width, initial-scale=1" name="viewport"/>
<link href="http://gmpg.org/xfn/11" rel="profile"/>
<script>(function(html){html.className = html.className.replace(/\bno-js\b/,'js')})(document.documentElement);</script>
<title>Python – Dr. Feng Li</title>
<link href="//feng.li" rel="dns-prefetch">
<link href="//fonts.googleapis.com" rel="dns-prefetch"/>
<link href="//s.w.org" rel="dns-prefetch"/>
<link href="https://feng.li/feed/" rel="alternate" title="Dr. Feng Li » Feed" type="application/rss+xml"/>
<link href="https://feng.li/comments/feed/" rel="alternate" title="Dr. Feng Li » Comments Feed" type="application/rss+xml"/>
<script type="text/javascript">
			window._wpemojiSettings = {"baseUrl":"https:\/\/s.w.org\/images\/core\/emoji\/2.4\/72x72\/","ext":".png","svgUrl":"https:\/\/s.w.org\/images\/core\/emoji\/2.4\/svg\/","svgExt":".svg","source":{"concatemoji":"https:\/\/feng.li\/wo

## The complete case

In [5]:
from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen('https://feng.li/python/')
bs = BeautifulSoup(html.read(), 'html.parser')
nameList = bs.findAll('div', {'class':'entry-content'})
for name in nameList:
    print(name.get_text())


This page servers as the primary guide for my students who want to learn Python.



## Web Scraping with `BeautifulSoup`

In [1]:
import logging
import requests
import sys
import urllib

from bs4 import BeautifulSoup
from collections import OrderedDict
from urllib.parse import urlencode

def get_list(comp, page):
    """Function to get  web list pages for a given company and page number.

    Args:
        comp: Company name.
        page: The page number.

    Returns:
        newsData: A dictionary with news title as its key and other details as values.

    """
    newsData = OrderedDict()
    href = 'http://search.sina.com.cn/?%s&range=title&c=news&num=20&col=1_7&page=%s' % (comp, page) # comp -> first %s; page -> 2nd %s; col=1_7 -> financial news in sina
    html = requests.get(href)
    # Parsing html
    soup = BeautifulSoup(html.content, 'html.parser')
    divs = soup.findAll('div', {"class": "r-info r-info2"})
    for div in divs:
        head = div.findAll('h2')[0]
        # News title
        titleinfo = head.find('a')
        title = titleinfo.get_text()
        # News url
        url = titleinfo['href']
        # Other info
        otherinfo = head.find('span', {"class": "fgray_time"}).get_text()
        source, date, time = otherinfo.split()
        # News abstract
        abstract = div.find('p', {"class": "content"}).get_text()
        newsData[title] = [date, source, abstract, url]
    return newsData



if __name__ == "__main__":
    compRawStr = '百度'
    # Dealing with character encoding
    comp = compRawStr.encode('gbk')
    d = {'q': comp}
    pname = urlencode(d)
    # Scraping and printing the first two pages
    for page in range(3)[1:]:
        newsData = get_list(pname, page)
        for ky in newsData:
            print('\001'.join([ky] + newsData[ky])) # "\001" as separator

Some characters could not be decoded, and were replaced with REPLACEMENT CHARACTER.


美团与百度合作无人驾驶送外卖，首单或落地雄安。2018-04-19新浪财经美团与百度合作无人驾驶送外卖，首单或落地雄安。http://finance.sina.com.cn/7x24/2018-04-19/doc-ifzihneq1276594.shtml
百度、一汽等7家企业获准在重庆开展自动驾驶“路测”。2018-04-19新浪财经百度、一汽等7家企业获准在重庆开展自动驾驶“路测”。http://finance.sina.com.cn/7x24/2018-04-19/doc-ifzihneq1239009.shtml
美团与百度合作无人驾驶送外卖，首单或落地雄安2018-04-19新浪财经美团与百度合作无人驾驶送外卖，首单或落地雄安】百度内部工作人员透露，百度与美团已达成相关合作，将无人驾驶技术应用到送餐环节，并计划在雄安率先试点。百度与美团这一合作原 ...http://finance.sina.com.cn/7x24/2018-04-19/doc-ifzihneq0108513.shtml
百度Apollo发布2.5版：新增方案成本直降九成2018-04-19新浪财经百度Apollo发布2.5版：新增方案成本直降九成】4月19日，百度对外发布Apollo 2.5版本，围绕场景、成本、车型、性能等维度进行了多项升级。http://finance.sina.com.cn/7x24/2018-04-19/doc-ifzihnep9851070.shtml
基于百度Apollo，首汽约车上线CI车载智能系统2018-04-19新浪财经基于百度Apollo，首汽约车上线CI车载智能系统】4月19日，首汽约车CI车载智能硬件系统正式上线。目前已在大连、成都、厦门等城市上线测试，随后将在全国范围内推广。http://finance.sina.com.cn/7x24/2018-04-19/doc-ifzfkmth6997964.shtml
百度与一汽、奇瑞和北汽就网络安全实验室合作2018-04-19中国证券网中国证券网讯 据腾讯科技4月19日消息，百度与一汽、奇瑞和北汽就网络安全实验室合作。http://finance.sina.com.cn/roll/2018-04-19/doc-ifzihnep9300219.shtml

Some characters could not be decoded, and were replaced with REPLACEMENT CHARACTER.


百度朱光：人工智能将帮助人类更专注于创造与想象2018-04-11中国证券报-中证网彭扬）百度高级副总裁朱光11日在亚洲博鳌论坛2018年年会“让人工智能落地”分论坛上表示，如同十年前开始重视互联网+一样，未来越来越多的公司会用到AI，把每个公司变成一个“AI+公司 ...http://finance.sina.com.cn/roll/2018-04-11/doc-ifyuwqez8996417.shtml
力帆股份：与百度在无人驾驶上有深度合作2018-04-11中国证券网中国证券网讯 力帆股份11日在互动平台上回复投资者提问时表示，公司与百度、盼达在新能源车无人驾驶开发上有深度合作；与重庆快键新能源汽车有限公司在新能源汽车供销上有战略合作 ...http://finance.sina.com.cn/stock/t/2018-04-11/doc-ifyteqtq8064834.shtml
腾讯阿里百度京东等巨头竞相试水区块链2018-04-11上海证券报区块链技术在商业世界中的应用已悄然铺开。记者梳理发现，最近一段时间以来，腾讯、阿里、百度、京东、华为、顺丰、谷歌、Facebook、三星等巨头已陆续试水区块链技术应用。http://finance.sina.com.cn/blockchain/roll/2018-04-11/doc-ifyteqtq7776091.shtml
长城汽车与百度签署汽车智能互联领域战略合作2018-04-10新浪财经长城汽车与百度签署汽车智能互联领域战略合作】4月9日，长城汽车和百度签署战略合作备忘录，宣布双方将在车辆智能网联、自动驾驶、共享出行、大数据四大领域展开战略合作，打造车辆 ...http://finance.sina.com.cn/7x24/2018-04-10/doc-ifyuwqez8279061.shtml
长城与百度签署汽车智能互联领域战略合作2018-04-10界面长城与百度签署汽车智能互联领域战略合作 4月9日，长城汽车和百度签署战略合作备忘录，宣布双方将在车辆智能网联、自动驾驶、共享出行、大数据四大领域展开战略合作，打造车辆智 ...http://finance.sina.com.cn/stock/s/2018-04-10/doc-ifyuwqez8265337.shtm

In [3]:
import logging
import requests
import sys

from bs4 import BeautifulSoup




def get_body(href):
    """Function to retrieve news content given its url.

    Args:
        href: url of the news to be crawled.

    Returns:
        content: the crawled news content.

    """
    html = requests.get(href)
    soup = BeautifulSoup(html.content, 'html.parser')
    div = soup.find('div', {"id": "artibody"})
    paras = div.findAll('p')
    content = ''
    for p in paras:
        ptext = p.get_text().strip().replace("\n", "")
        content += ptext
    return content



if __name__ == "__main__":
    logging.getLogger().setLevel(logging.INFO)
    # Getting and printing content for each url in the crawled web list pages
    with open("data/baidu_list") as f:
        for line in f:
            title, date, source, abstract, href = line.strip().split('\001')
            # Printing progress onto console
            logging.info('Scraping ' + href)
            content = get_body(href)
            print('\001'.join([title, date, source, abstract, href, content]))

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-14/doc-ifyiaewh9121960.shtml
INFO:root:Scraping http://finance.sina.com.cn/money/bank/bank_hydt/2017-07-13/doc-ifyiakwa4000736.shtml


打不过俄罗斯“百度” Uber向战斗民族认怂了2017-07-14一财网俄罗斯业务移交Yandex 据彭博社报道，Uber昨日宣布将其在俄罗斯等几个国家的业务以合并的形式移交给俄罗斯打车服务商Yandex.Taxi。http://finance.sina.com.cn/roll/2017-07-14/doc-ifyiaewh9121960.shtml继中国市场后，Uber又将撤出俄罗斯市场，而投资者猜测这家公司甚至有可能撤出东南亚及印度市场。俄罗斯业务移交Yandex据彭博社报道，Uber昨日宣布将其在俄罗斯等几个国家的业务以合并的形式移交给俄罗斯打车服务商Yandex.Taxi。Uber此次合并中卖掉的除了俄罗斯市场外还包括亚美尼亚、阿塞拜疆、白俄罗斯、格鲁吉亚和哈萨克斯坦的打车业务，同时获得Yandex的部分股份作为交换，这与之前Uber和滴滴打车的合并方式非常相似。双方将成立一家合资公司，Uber将向合资公司注资2.25亿美元，占股36.6%;Yandex将注资1亿美元，占股59.3%，而剩余4.1%则由员工持股。这笔交易会在今年的第四季度完成，这家尚未命名的新公司估值在37.3亿美元左右。Yandex是俄罗斯最大的搜索引擎公司，Yandex.Taxi是其于2011年在俄罗斯推出的打车服务，在俄罗斯的打车市场占据着主导地位。2014年，Uber进入俄罗斯市场，双方展开了一场激烈的争夺，如同此前在中国市场对战滴滴一样，Uber在俄罗斯也与Yandex.Taxi陷入了补贴大战中。Uber表示，在俄罗斯与Yandex.Taxi争夺市场令其过去三年亏损了约1.7亿美元。Yandex.Taxi在俄罗斯运营的时间比Uber登陆该国早三年，并展示出降低服务价格以吸引用户的强烈意愿。对于此次合作，Uber欧中非地区负责人Pierre表示，双方联手不仅有利于Uber和Yandex，对于整个地区的司机和乘客而言，都是好事。同时，合作可以帮助Uber继续打造可持续的全球业务。在中国的坎坷竞争路该交易是继退出中国市场后Uber又一次撤出其主要市场。在中国市场上，Uber为了滴滴出行抢占市场损失了大约20亿美元之后，决定将其市场份额交予滴滴打车并得到滴滴出行17.5%的股份。Uber在2014年2月13日宣布正式进入中国市场。2013年8月，Uber正式在上海试运营。2014

INFO:root:Scraping http://finance.sina.com.cn/china/dfjj/2017-07-12/doc-ifyiamif2703041.shtml


百度金融弯道超车2017-07-13陆家嘴x3000;　百度金融弯道超车　　文/本刊记者 何映霏 摄影/OVE　　“人工智能和大数据给互联网金融的冲击，给像百度这样的有技术优势的公司弯道超车的机会。http://finance.sina.com.cn/money/bank/bank_hydt/2017-07-13/doc-ifyiakwa4000736.shtml基金经理老鼠仓，说好保本变巨亏，买基金被坑请到【基金曝光台】！信用卡无故遭盗刷，银行存款变保险，理财被骗请猛戳【金融曝光台】！百度金融弯道超车文/本刊记者 何映霏  摄影/OVE“人工智能和大数据给互联网金融的冲击，给像百度这样的有技术优势的公司弯道超车的机会。”百度副总裁、负责消费金融业务的黄爽在接受《陆家嘴》杂志采访时表示。技术基因全面注入百度金融BAT及京东之所以被称为互联网巨头，是由于垄断了70%以上的用户时间。巨头们一手掌握着流量，一手掌握着流量背后所代表的场景，而流量和场景又恰好是金融变现最好的方式之一，这也成为了互联网巨头向金融领域高歌猛进的充足理由。以支付宝花呗与京东白条为代表的电商场景消费金融，以电商平台为依托，支付作为入口，最终在电商平台上产生消费，消费过程中又接入各种金融产品，如消费分期等，这在无形中培养了广大受众的用户习惯。目前除了支付宝有蚂蚁花呗，京东有白条，百度研发了有钱花，苏宁有任性付，快钱有快易花。在互联网金融1.0时代，一切以场景为王。无论是线上还是线下，信用分期服务都依托于商业机构或者电商、服务交易的特定场景。但是到了互联网金融2.0时代，由于移动时代智能手机的发展，网络背后的一个个主体能够被识别。再加上用户在网络上沉淀的各种数据，其个体画像可以被精准刻画。近几年，互联网金融的竞争已经从资金端向资产端倾斜，黄爽看来，谈及资产端线上化时，需解决三个问题：一是如何通过线上触达需求方；二是核实需求方的真实身份；三是你需要给他匹配什么样的产品形态。“百度擅长于做第一和第三点，通过搜索引擎了解他人诉求，搜索到的信息点才是最真实的数据，朋友圈里发的可能只是你想成为的自己，甚至有故意经营的印记。” 黄爽谈道，百度以搜索立身，不仅拥有风控模型，还深挖了复杂的需求模型和响应模型，例如人脸识别系统就可以帮助百度消费金融高效地核实身份、反欺诈，还能降低人工审核时间，缩短审核周期，使消

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-12/doc-ifyhwehx5784774.shtml


保定与百度签约建设智能交通示范城市 开展自动驾驶技术测试2017-07-12澎湃新闻人民网石家庄7月12日消息，日前，河北保定市与百度正式签订共建智能交通示范城市的战略合作协议，双方在自动驾驶相关技术测试、体验示范、商业运营及标准法规探索等方面达成合作 ...http://finance.sina.com.cn/china/dfjj/2017-07-12/doc-ifyiamif2703041.shtml河北保定将建设智能交通示范城市来源：人民网张志锋、尹晓龙人民网石家庄7月12日消息，日前，河北保定市与百度正式签订共建智能交通示范城市的战略合作协议，双方在自动驾驶相关技术测试、体验示范、商业运营及标准法规探索等方面达成合作。双方将依托保定市提供的封闭场所、城市开放道路基础设施和数据等资源，结合人工智能、自动驾驶等技术，在未来3-5年内，开展自动驾驶相关技术测试、体验示范、商业运营及标准法规探索等合作，共建智能交通示范城市，推动自动驾驶新技术、新产品、新服务的实验验证与成果转化。进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-11/doc-ifyhvyie1100596.shtml


百度云支撑“云上阳泉”智慧城市和大数据产业发展2017-07-12中国新闻网7月11日，百度与阳泉市政府正式签署多项战略合作协议，以“云物移大智”(云计算、物联网、移动互联网、大数据、智慧城市)为引领，共同推进“智慧阳泉”、“政务云计算”、“大数据产 ...http://finance.sina.com.cn/roll/2017-07-12/doc-ifyhwehx5784774.shtml中新网7月12日电 7月11日，百度与阳泉市政府正式签署多项战略合作协议，以“云物移大智”(云计算、物联网、移动互联网、大数据、智慧城市)为引领，共同推进“智慧阳泉”、“政务云计算”、“大数据产业”等快速建设和发展。ABC让整个城市“智能化”随着AI时代的到来，智慧城市未来将是AI落地的重要场景。在此次百度与阳泉签署的合作协议中，“智慧阳泉”的建设成为“重头戏”。百度将与阳泉共同打造“阳泉大脑”，建设山西(阳泉)智能物联网应用示范基地，探索智慧城市建设新模式。依托ABC(人工智能AI、大数据Big data、云计算Cloud Computing)和物联网技术优势，以及百度云计算(阳泉)中心落户阳泉开发区的资源优势，百度将支持阳泉成立“山西(阳泉)大数据资产运营公司”，推进包括城市能源调度和管理等在内的城市智能物联网项目。在此次合作中，通过百度云“天工”智能物联网平台，百度将以城市物联网为核心，助力阳泉将城市的地下管网(供水、供暖、天然气、污水)、楼宇和交通基础设施等数据统一接入城市数据资产平台，在资产平台上再搭建各种城市的应用。同时，百度和阳泉市一起探索打造基于语音交互的城市公共服务平台，把DuerOS、城市服务知识图谱、IoT结合起来，将为阳泉提供AI公共服务。百度云“天工”平台融入ABC技术优势，能够为工业制造、能源、车联网、物流等行业提供完整的解决方案，将助力阳泉城市物联网的建设和推广，为山西带来IoT和AI产业链上的企业的入驻，形成产业聚集效应。未来，随着先进的AI和IoT城市方案向全国推广，将进一步带动山西经济的发展。同时，百度不仅重点推动ABC和物联网技术在智慧能源、智慧医疗、智慧政务、智慧交通、智慧旅游等领域落地应用，让阳泉整个城市变得“智能化”；还将与阳泉经济技术开发区展开合作，共同培育一批互联网企业和人才，打造山西互联网创新创业新生态，推动“双创”发展

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-11/doc-ifyhvyie1032239.shtml


山西煤企携手百度智取转型 煤炭不再“傻大黑粗”2017-07-11中国新闻网中新网太原7月11日电(范丽芳)11日，阳煤集团与中国知名互联网公司百度达成战略合作协议，双方将利用百度领先的人工智能、大数据、云计算技术与阳煤集团领先的煤炭开采、煤化工生产 ...http://finance.sina.com.cn/roll/2017-07-11/doc-ifyhvyie1100596.shtml中新网太原7月11日电 (范丽芳)11日，阳煤集团与中国知名互联网公司百度达成战略合作协议，双方将利用百度领先的人工智能、大数据、云计算技术与阳煤集团领先的煤炭开采、煤化工生产、大宗物流管理能力，共同推进煤炭行业“智”取转型，改变以往外界对煤炭“傻大黑粗”的印象。当日，百度公司创始人李彦宏现身签约仪式支持家乡发展。根据双方协议，在煤炭云开采方面，阳煤集团将结合百度公司ABC((AI、Bigdata、CloudComputing))技术优势，推动煤炭工业科技创新，建立以智能感知、智能控制、物联网等信息技术和以大数据、风险智能判识、防控、监控预警等安全开采为支撑的“互联网+煤炭科学开采”，实现时空上准确高效的煤炭无人(少人)智能开采与灾害防控一体化的未来采矿新模式。在智能云煤化工方面，双方将联合优质企业，共同设计建造中国最领先的智能化工厂，提高煤化工生产的安全性、环保性；在物流方面，依托山西国际陆港集团，构建“物流+互联网+大数据”相融合的一体化产业生态平台，为上中下游企业提供集中服务，为物流组织、市场营销、经营管理提供智能化大数据分析决策支持，为线上线下物流运输、仓储配送、商品交易、金融服务、物流诚信等业务提供一站式、全方位服务，形成覆盖线上线下的物流生态系统。在中国，煤炭行业是一个较为特殊的行业，不仅表现在它为我国经济社会发展提供了60%以上的基础和支柱性能源保障，同时也是长期以来国家工业的重要行业。对于煤炭大省山西，该行业的转型升级对当地经济尤为重要。阳煤集团作为山西省五大煤炭集团之一，在引领山西这个煤炭大省的资源转型、产业升级发展方面具有重要使命和意义。作为技术驱动型企业的百度，凭借17年的技术积累，近年来在ABC等领域快速发展，特别是以百度云为核心平台，已经开始与中国传统工业企业展开深度融合。阳煤集团党委书记、董事长翟红认为：“此次合作希望让煤炭行业更加智能化，将

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-11/doc-ifyhweua4718968.shtml


通信行业:百度AI开发者大会亮点十足,关注车联网、大数据投资机会2017-07-11全景网5G和物联网均处于快速推进和逐步落地中,电信运营商陆续公布NB-IoT网络建设规划,MWC上各运营商和设备商公布5G技术发展动态,百度在AI开发者大会首次提出自动驾驶生态和长期AI、车联网、大数 ...http://finance.sina.com.cn/roll/2017-07-11/doc-ifyhvyie1032239.shtml近期推荐组合:英维克(002837)、美利云(000815)、宝信软件(600845)、中际装备(300308)、光迅科技(002281)、东信和平(002017)、永鼎股份(600105)、动力源(600405)。市场回顾:上周通信(申万)指数上涨1.23%;沪深300指数下跌0.3%;行业跑赢大盘1.26个百分点。策略观点:通信板块上周表现强于大盘,总体走势良好,通信板块上涨拉动力呈现一定的变化。白马股涨势有所缓和,而此前跌幅较多的中小盘股呈现明显上涨趋势。一方面,中报期临近,一些2016年业绩不佳的中小盘股在股价长期低迷之后可能迎来中报超预期有利因素,尤其超跌个股在市场信心支持下稳步上升。另一方面,通信行业未来主要增长核心5G和物联网均处于快速推进和逐步落地中,电信运营商陆续公布NB-IoT网络建设规划,MWC上各运营商和设备商公布5G技术发展动态,百度在AI开发者大会首次提出自动驾驶生态和长期AI、车联网、大数据方面布局。在行业发展积极向上刺激下,相关标的受到市场关注并产生明显的向上动力。在5G蓬勃发展的大背景下,AI、车联网、大数据平台等业务板块的崛起速度有望超预期,建议关注相关投资机会。百度AI开发者大会召开,百度产业链概念逐渐形成:2017年7月5日,“百度AI开发者大会”举办,百度宣布将推出DuerOS和Apollo两大开放平台,为多个行业提供一流的开发工具和有效的AI行业解决方案。1、在技术储备方面,百度已开放60项AI核心能力,含此次首次开放的14项新能力。其对话式人工智能系统DuerOS拥有目前最容易上手的设备开放平台、真正能听清听懂的对话核心系统以及丰富优质的技能平台,以技术和产业优势领跑国内市场。Apollo开放平台方面,百度除了宣布首期将开放Apollo1.0封闭园区自动驾驶能力,还完整披露了Apollo开放

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-11/doc-ifyhvyie0955704.shtml


生态联盟长名单背后：百度Apollo到底开放什么？2017-07-1121世纪经济报道生态联盟长名单背后：百度Apollo到底开放什么？7月5日，百度再一次制造了新闻。在百度AI开发者大会现场，百度创始人、董事长兼首席执行官李彦宏登台，自信宣称，移动互联网的时代结 ...http://finance.sina.com.cn/roll/2017-07-11/doc-ifyhweua4718968.shtml生态联盟长名单背后：百度Apollo到底开放什么？7月5日，百度再一次制造了新闻。在百度AI开发者大会现场，百度创始人、董事长兼首席执行官李彦宏登台，自信宣称，移动互联网的时代结束了，接下来是AI时代。在历次技术革命中，一个人、一家企业，甚至一个国家，可以选择的道路只有两条：要么加入浪潮，要么观望徘徊。当天，百度Apollo开放平台作为百度AI生态重要战略，首次面向开发者及各行业合作伙伴集中展现，释放出生态势能。而在AI时代，算法和数据都非常重要，分散的数据是没有用途，数据一定要累积，价值才能出现。百度首席运营官陆奇在公布Apollo整体战略和开放体系时表示：“Apollo是汽车工业的一个重要里程碑，它本质上就像是自主驾驶行业的‘安卓’系统，但更开放更强大。”百度不造车，Apollo也秉承了这样的理念。换言之，百度的Apollo计划的核心，是让人工智能赋能汽车行业。与此同时，陆奇不再强调百度的控制能力，而是宣布有超过50家合作伙伴组成了Apollo生态，涵盖主机厂、零部件供应商和新创车企和技术公司，还有科研院校以及地方政府。“百度为什么要发布开放的Apollo计划，因为软件不能单独存在，需要生态支持，将自己无法做的事情交回专业的人来做。”7月8日，一位熟悉Apollo计划的业内人士，在接受21世纪经济报道记者采访时表示。百度、博世合作样本《智能时代：大数据与智能革命重新定义未来》一书中写道：汽车这个老行业，在引入大数据和机器智能之后就脱胎换骨，变成了一个新的行业。当汽车与互联网融合之后，这个行业就变得更有意思。当天，Apollo生态合作伙伴联盟正式成立，首批50多家成员包括奇瑞、一汽、长安、长城等15家领先的OEM厂商，博世、大陆、采埃孚、德赛西威等10家Tier1厂商，还包括NVIDIA、微软、中兴通讯、Velodyne、TomTom、紫光展锐、富迪等1

INFO:root:Scraping http://finance.sina.com.cn/consume/puguangtai/2017-07-11/doc-ifyhvyie0949465.shtml


长安参与百度Apollo计划：平台催生新买卖关系？2017-07-1121世纪经济报道本报记者？纪伟？北京报道？？？？“在自动驾驶领域，现在传统车企与百度、谷歌选择的路线不同。百度将其高精度地图以及人工智能的优势发挥出来，双方在合作上能够形成良好的互补 ...http://finance.sina.com.cn/roll/2017-07-11/doc-ifyhvyie0955704.shtml本报记者 纪伟 北京报道“在自动驾驶领域，现在传统车企与百度、谷歌选择的路线不同。百度将其高精度地图以及人工智能的优势发挥出来，双方在合作上能够形成良好的互补，很可能会加快L3或者L4整体产品推进的速度。”7月9日，长安汽车研究院常务副院长谭本宏在接受21世纪经济报道记者采访时表示。在自动驾驶领域，汽车行业将不同的发展阶段划分为五个等级。其中L3指的是高度的自动驾驶，L4表示全自动驾驶，而L5指的是车辆的智能化已经达到了人类驾驶的水平。7月5日，百度在北京国家会议中心召开百度AI开发者大会，发布了Apollo 1.0的开放细节，以及Apollo开放平台的整体战略和开放路线图。如何去理解Apollo开放平台，当天百度董事会副主席、百度集团总裁兼首席运营官陆奇，用手机安卓平台来进行类比，并表示Apollo开放平台会比安卓更开放、更强大。同时，用“开放能力、共享资源、加速创新、持续共赢”16字宣言概述了Apollo生态的战略目标。尤为重要的是，Apollo计划能否顺利推进取决于合作伙伴参与程度。21世纪经济报道记者了解到，Apollo初始合作伙伴的阵容已超过50家企业。目前Apollo生态合作伙伴联盟已辐射OEM、Tier1、地图公司、芯片公司、基金投资、个人开发者、创业公司、研究机构及政府机构等。但这么多合作伙伴如何参与到Apollo计划中，也是业界关注的焦点。7月8日，一位接近百度的业内人士在接受21世纪经济报道记者采访时表示：“在百度Apollo计划里，企业相互之间的合作思维需要发生转变，数据需要众多企业来提供，如果企业参与并提供数据多，那么Apollo的能力也将越来越强。”市场数据成为合作的桥梁上述人士提道：“在自动驾驶领域中，百度只做云服务和软件平台，这样可以更好理解百度与其他企业之间的关系。”作为百度重要合作伙伴之一，奇瑞汽车董事长尹同跃受邀作为Apollo生态

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhwehx5588361.shtml


涉赌App推广追踪：UC头条已关一批 今日头条百度还有2017-07-11新浪综合UC头条：已关一批涉赌App账号 今日头条、手机百度还有捕鱼类游戏及涉赌棋牌App推广；有代理公司称仍可做涉赌App推广 来源：新京报 昨晚，今日头条、手机百度上，仍有捕鱼类游戏及涉赌 ...http://finance.sina.com.cn/consume/puguangtai/2017-07-11/doc-ifyhvyie0949465.shtmlUC头条：已关一批涉赌App账号今日头条、手机百度还有捕鱼类游戏及涉赌棋牌App推广；有代理公司称仍可做涉赌App推广来源：新京报今日头条、手机百度还有捕鱼类游戏及涉赌棋牌App推广；有代理公司称仍可做涉赌App推广■ “今日头条、UC头条频现涉赌App推广”追踪新京报记者近日调查发现，今日头条、UC头条、手机百度等客户端频现涉赌App推广，吸引玩家点击下载。这主要是一些第三方代理公司通过“套户”在各平台推广涉赌App。但平台自身也存在监管漏洞，今日头条有广告销售人员称，涉赌App只要不出现炸金花等敏感字眼，就能通过审核得以推广。此外，多款涉赌App可以由支付宝、微信充值，提现则只能用支付宝（新京报7月10日报道）。昨日，UC头条、百度、支付宝、微信支付对该报道进行了回应。支付宝表示，多个涉赌App扣款公司擅自修改支付接口用于涉赌App，已停止合作。UC头条称，7月初UC已接到用户投诉，关闭了一批涉赌棋牌类App账号。今日头条暂未回应。新京报记者昨日在今日头条、手机百度上发现，仍有捕鱼类游戏及涉赌棋牌App推广。有代理公司表示，仍可投放涉赌App推广。■ 回访代理公司：仍可投放涉赌App广告昨晚，新京报记者打开今日头条、UC头条、手机百度等客户端，在UC头条暂未发现涉赌棋牌类App的推广页面，今日头条仍有捕鱼类游戏和涉赌App的推广广告。记者下载了一款棋牌游戏发现，充值后玩游戏可兑换礼物及奖品。手机百度上，棋牌App和捕鱼游戏均有推广，记者随机下载了一款棋牌游戏App，登录后是一款此前报道的涉赌App，具有直接充值及提现功能。新京报记者此前调查发现，有第三方代理公司专门做非企业务代理，在今日头条、UC头条、手机百度等平台通过“套户”违规推广涉赌App。昨日，记者联系了多家第三方代理公司，有公司称，仍可以在今日头条做涉赌App推

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhweua4664758.shtml


李彦宏“实战”乘坐百度无人车，亲自为无人驾驶技术站台2017-07-10中国经济周刊x3000;　李彦宏“实战”乘坐百度无人车，亲自为无人驾驶技术站台　　（本文刊发于《中国经济周刊》2017年第27期）　　李彦宏“实战”乘坐百度无人车，亲自为无人 ...http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhwehx5588361.shtml李彦宏“实战”乘坐百度无人车，亲自为无人驾驶技术站台（本文刊发于《中国经济周刊》2017年第27期）李彦宏“实战”乘坐百度无人车，亲自为无人驾驶技术站台7月5日，百度创始人、董事长兼CEO李彦宏乘坐百度无人驾驶汽车进入百度AI开发者大会会场，成为百度自动驾驶领域“Apollo（阿波罗）计划”推行成果的重要体现。这一计划意在向汽车行业及自动驾驶领域的合作伙伴提供一个开放、完整、安全的软件平台，帮助他们结合车辆和硬件系统，快速搭建一套属于自己的完整的自动驾驶系统。对此，百度首席运营官兼总裁陆奇介绍，Apollo是自动驾驶的安卓，并宣布Apollo生态成立，目前已拥有超过50家合作伙伴，包括整车厂商、集成制造商、芯片厂商、传感技术企业、研究机构等。李彦宏表示，AI是必由之路，开放让所有人都收获更多。分享与合作是这个时代的“聚宝盆”，开放一定可以跑赢封闭。百度目前已经获得了2000多个人工智能相关的专利，现在将主动把这些技术都开放、共享出来。值得注意的是，有交管局人士称，现行法规并不允许无人驾驶上路。早在2015年百度无人驾驶汽车就已首次在北京的五环进行测试，但至于是否经过相关部门审批，目前尚不得而知。迅雷创立以来首度换帅，第一代互联网公司进入“交班”期近日，迅雷发布公告宣布管理层调整，陈磊接替创始人邹胜龙成为CEO，邹胜龙则继续作为董事长，关注包括AI在内的云计算产品和技术创新以及战略投资。实际上，20世纪90年代末到2000年初成立的最早的一批中国互联网公司，最近几年进入了密集的交班期。张勇接任阿里巴巴CEO，李彦宏将百度的业务交给了陆奇，而腾讯的日常运营也早在10年前就开始由刘炽平协助负责。大疆汪滔成2017胡润少壮派白手起家中国榜首富胡润研究院近日发布《2017胡润全球少壮派白手起家富豪榜》，统计出全球40岁以下白手起家财富超10亿美元的富豪，其中，“无人机大王”大疆创新C

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhweua4645809.shtml


[传闻求证]福田汽车是百度自动驾驶Apollo生态重要合作伙伴？2017-07-10全景网全景网7月10日讯？近日，李彦宏乘坐无人驾驶汽车上路引发关注。有投资者听闻百度福田汽车是百度自动驾驶？Apollo生态重要合作伙伴，来看上市公司如何回应？福田汽车是百度自动驾驶 ...http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhweua4664758.shtml全景网7月10日讯 近日，李彦宏乘坐无人驾驶汽车上路引发关注。有投资者听闻百度福田汽车是百度自动驾驶 Apollo生态重要合作伙伴，来看上市公司如何回应？福田汽车是百度自动驾驶 Apollo生态重要合作伙伴？福田汽车(600166):2016年10月，福田汽车与百度签署战略协议，建立战略合作伙伴关系。问：今天媒体报道百度自动驾驶 Apollo生态重要合作伙伴，福田汽车在里面，请问媒体报道情况是否属实？答：2016年10月，福田汽车与百度签署战略协议，建立战略合作伙伴关系，详见《临2016—073 关于北京百度网讯科技有限公司与本公司签署战略合作框架协议的公告》。证金已经买够航天信息5%举牌线？航天信息(600271):公司一季报中，证金持股比例为4.96%，目前公司未接到证金公司任何其他后续的计划安排。问：市场传闻，证金已经买够5%举牌线，请问是否属实？答：公司一季报中，证金持股比例为4.96%，目前公司未接到证金公司任何其他后续的计划安排。协鑫集成在安徽金寨的两个100MW项目已经并网？协鑫集成(002506):属实。问：新闻里说协鑫集成在安徽金寨的两个100MW项目已经并网了，项目将惠及4000多户，带动当地贫困人口脱贫，而且这个项目还是协鑫参与630的抢装项目，请问这是真的吗？对17年的利润会有影响吗？答：公司为金寨两个100MW光伏电站项目提供设计、采购到施工的EPC总包服务。公司始终从客户需求角度出发，提供“精化技术研发、优化电站设计”的专业服务，保证了光伏电站顺利并网。预计将对公司17年利润产生一定的积极影响。协鑫集成天价注入大股东亏损公司、16年第三季度存在诸多业绩操纵的迹象？协鑫集成(002506):不属实。问：证券市场周刊报道：贵公司天价注入大股东亏损公司。破产重组后的上市公司并没有轻装上阵，却走上了款难还、负债累累的老路，没有实质性改

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhweua4632953.shtml


权威数据“走出国门” 百度地图“壮胆”国人闯天下2017-07-10中国新闻网一是对海外风俗不了解难以游玩到精髓，二是在海外极易迷路，出国便是两眼一抹黑。洞察到中国游客的迫切需求，百度地图加速了国际化进程。据了解，目前百度地图已经支持全球209个 ...http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhweua4645809.shtml中新网7月10日电 近年来，国内出境游人数已经大幅高于入境游人数，腰包鼓起来的中国人更想在全世界看看。但以往主要有两个问题横亘中国游客、尤其是老年游客面前，一是对海外风俗不了解难以游玩到精髓，二是在海外极易迷路，出国便是两眼一抹黑。洞察到中国游客的迫切需求，百度地图加速了国际化进程。据了解，目前百度地图已经支持全球209个国家和地区的使用，覆盖范围极广。更为关键的是，百度地图搭建平台携手权威机构，建立全球化地图生态圈，帮助中国串联起海外优质服务，进而逐步从全球化迈向本地化。包括印尼国家旅游部在内，百度地图与泰国、韩国、北欧四国等国家旅游部门都达成战略合作，让中国游客走遍天下都有“国家”撑腰。互惠共赢更是受到当地政府赞扬，印尼旅游部长Arief Yahya就表示：“与百度地图的战略伙伴关系产生了令人印象深刻的结果，访问印度尼西亚的中国游客数量激增。我们乐观的认为，随着百度地图的利用率提高，中国游客将更多的了解印度尼西亚，会更容易到达印度尼西亚。”作为中国企业，百度地图相关负责人在此前的印尼发布会上，与印尼国家旅游部部长并肩而坐，共同探讨合作未来。海量数据中保证每一个POI点的及时更新，以及在模糊搜索中能够准确体现，是一个世界性的难题。百度地图的海外之路有各国政府和旅游部门助力，相关内容由权威机构自主更新，让中国游客得到更接近完美的答案。目前，百度地图在国内占据绝对优势地位，全球POI总数超1.4亿，每日响应位置服务请求超720亿次，是中国地图市场上的领先者。进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/stock/t/2017-07-10/doc-ifyhvyie0864187.shtml


英特尔与百度携手 推动人工智能创新与变革2017-07-10中国新闻网Amir Khosrowshahi在百度开发者大会上分享英特尔在人工智能领域的战略布局与技术优势 中新网7月10日电 作为百度顶级合作伙伴，英特尔日前受邀参与了2017年“百度AI开发者大会”(Baidu ...http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhweua4632953.shtml中新网7月10日电 作为百度顶级合作伙伴，英特尔日前受邀参与了2017年“百度AI开发者大会”(Baidu Create 2017)。英特尔人工智能产品事业部首席技术官Amir Khosrowshahi受邀成为百度集团总裁兼首席运营官陆奇主题演讲的嘉宾，并发表了题为《英特尔架构助力人工智能》的讲话，介绍了英特尔和百度多年来在人工智能等众多领域的深度合作，涵盖了百度大脑、百度云和DuerOS(对话式人工智能系统)等方面。英特尔和百度在AI众多领域的深度合作，涵盖了自动驾驶、对话式人工智能系统、物联网设备到数据中心的AI深度学习研发和服务部署、基础设施优化等，具体包括：在自动驾驶领域中，英特尔和百度共同开发解决方案。对话式人工智能领域，英特尔已与百度展开接触。未来在芯片技术层面，将会有越来越多的深度合作。不仅是边缘计算，英特尔和百度在百度大脑和百度云这两方面也是紧密合。百度的深度学习机构(IDL)已经部署了英特尔至强融核处理器和OPA技术来支持自然语言处理项目。此外，百度和英特尔也正在联合制定深度学习的基准框架，例如Deep Bench基准，从而作为一种行业标准来评估市场中各种处理平台的性能。电源管理是当前数据中心的一个重要课题，特别是现在的人工智能平台普遍存在高功耗的情况下。英特尔和百度在这方面合作了许多项目，例如液体冷却，机架和服务器的48V电源等等。百度已经在内部署了英特尔至强融核处理器，用以支持一些深度学习工作负载以及高性能计算应用。基于英特尔平台优化的框架，例如Caffe, TensorFlow, 甚至是深度学习技术及应用国家工程实验室的深度学习平台PaddlePaddle，完成了部分图像和视频深度学习的工作。对于国家机构和大学，百度云正在尝试提供并行应用竞争项目，以支持学界完善和加强其在高性能计算应用上的技能。Amir在演讲中还表示，英特

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhweua4586490.shtml


易华录：与百度及高德实现数据产品服务对接2017-07-10中国证券网中国证券网讯 易华录在投资者互动平台上表示，公司与百度、高德之间开展深化合作，实现了双方数据产品服务对接，在厦门、大连、枣庄、廊坊等多个城市提供了交通互联网数据服务。http://finance.sina.com.cn/stock/t/2017-07-10/doc-ifyhvyie0864187.shtml中国证券网讯 易华录在投资者互动平台上表示，公司与百度、高德之间开展深化合作，实现了双方数据产品服务对接，在厦门、大连、枣庄、廊坊等多个城市提供了交通互联网数据服务。进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/stock/usstock/c/2017-07-10/doc-ifyhwehx5440657.shtml


百度开放自动驾驶软件平台带来哪些期待？2017-07-10新华网新华社北京7月10日电？题：百度开放自动驾驶软件平台带来哪些期待？新华社记者鲁畅 几天前，百度创始人李彦宏乘自动驾驶汽车前往百度“ＡＩ开发者大会”现场吸引了不少眼球。http://finance.sina.com.cn/roll/2017-07-10/doc-ifyhweua4586490.shtml新华社北京7月10日电  题：百度开放自动驾驶软件平台带来哪些期待？新华社记者鲁畅几天前，百度创始人李彦宏乘自动驾驶汽车前往百度“ＡＩ开发者大会”现场吸引了不少眼球。会场外，舆论对自动驾驶汽车上路的合法性有争议，相关部门介入调查；会场内，百度总裁陆奇宣布开放名为Ａｐｏｌｌｏ的自动驾驶平台，开发者借助Ａｐｏｌｌｏ能力，可以搭建自己的自动驾驶汽车。一个开放的、完整的、安全的软件平台，将帮助中国国内及海外汽车行业及自动驾驶领域的合作伙伴结合车辆和硬件系统，快速搭建一套属于自己的完整自动驾驶系统。记者了解到，百度今年四月宣布Ａｐｏｌｌｏ计划以来，已经与全球50多家车企进行合作，包括奇瑞、北京汽车、一汽解放、博世集团、大陆集团等。根据Ａｐｏｌｌｏ开放计划，百度计划在2017年7月开放封闭场地循迹自动驾驶，9月开放固定车道跟车自动驾驶，年底输出简单城市路况的自动驾驶能力……在2020年之前实现高速和城市道路全路网自动驾驶。“不同于传统汽车，智能驾驶汽车将拥有全新产业链，这其中除了传统厂商，人工智能企业、芯片供应商等新加入的参与者也将扮演重要角色。同时，智能驾驶需要空前的行业协作，各个参与者各施其长才能最大程度提高生产效率，加速智能驾驶时代的到来。”大陆集团相关负责人说。“在技术快速更新迭代的当下，从事自动驾驶研究的从业者靠一己之力很难跟上行业潮流。”美国无人车零配件供应商ＡｕｔｏｎｏｍｏｕＳｔｕｆｆ首席执行官罗伯特认为，随着平台合作伙伴增多，共享的数据、资源和技术将成倍增加，这意味着开发者和企业将直接进入自动驾驶高阶研究，这将大幅提升自动驾驶行业的发展速度。目前，百度、谷歌、苹果等科技巨头都在自动驾驶领域进行了持续投入，并取得成果。同时，在车企方面，特斯拉仰仗车厂与平台技术集于一身的优势，快速推进智能驾驶能力，已经在官网给出Ｌ5（按照美国交通管理部门标准的全自动驾驶）级别套件，其他大部分车企则走渐进路线，以辅

INFO:root:Scraping http://finance.sina.com.cn/chanjing/gsnews/2017-07-10/doc-ifyhweua4551056.shtml


被质疑勾结莆田系医院在地图上捣鬼 百度否认2017-07-10大洋网-广州日报7月7日，微博名为“深圳胖胖熊”的深圳儿童医院副院长麻晓鹏发微博表示，“深圳市儿童医院地址本来在福田区益田路7019号，百度地图偏偏在它的地址搜索中把莆田系的远东妇儿医院的地 ...http://finance.sina.com.cn/stock/usstock/c/2017-07-10/doc-ifyhwehx5440657.shtml广州日报讯 （全媒体记者刘幸、倪明）7月7日，微博名为“深圳胖胖熊”的深圳儿童医院副院长麻晓鹏发微博表示，“深圳市儿童医院地址本来在福田区益田路7019号，百度地图偏偏在它的地址搜索中把莆田系的远东妇儿医院的地址链接到深圳市儿童医院的名下，而且放到了第二位。导致许多想来我院看病的家长被误导到莆田系医院。”很快，网络上有关“百度地图再勾结莆田系医院，这次连儿童都不放过？”等帖子引起各界关注。是否故意引导患者至莆田系医院？从麻晓鹏这条微博的配图中可以看到，在百度地图中搜索“深圳市儿童医院”，第二条搜索结果的名字是“深圳市儿童医院”，但地址却是“深圳市-罗湖区-深南东路2097号”，查询可知这个地址属于莆田系的“远东妇儿医院“。也就是说，百度把要去深圳儿童医院看病的孩子家长，引导去了莆田系的医院。北京大学深圳医院妇产科副主任医师刘淼（微博名为淼哥故事会）也发文进行了声讨：真正坑的，就是那些刚来深圳的新人，或者病急乱投医的家长。这类人，生活拮据、信息闭塞，没什么影响力，即使被骗了，也人微言轻，投诉无门。截至昨日19时，深圳儿童医院副院长的原微博已获5600多次转发和1300多条评论。很多网友都在呼吁媒体跟进。有微博大V评论称，“百度地图和百度搜索一样，一切只为了钱服务，丝毫不在乎人的生命安全。百度地图这次居然连儿童都不放过。”有网友感慨，曾经的段子“百度无人汽车直接导航带你去莆田系医院”，很快就不是段子了。百度：百度地图标注免费昨日，百度官方发布了《关于“深圳市儿童医院”搜索结果误判的说明》（下称《说明》），百度表示，“日前，我们在微博上收到了一位深圳用户的报错，称在百度地图搜索‘深圳市儿童医院’关键词时，除正常搜索结果外，有一条结果错误指向另外一家医院。我们注意到，有个别自媒体将此解读为商业广告干扰正常搜索结果。百度地图在此郑重澄清，百度地图的标注是完

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-09/doc-ifyhweua4512750.shtml


百度地图勾结莆田系医院？回应：不存在商业行为标注免费2017-07-10大洋网-广州日报百度：不存在任何售卖地图标注的商业行为 大洋网-广州日报 刘幸、倪明 广州日报讯（全媒体记者刘幸、倪明）7月7日，微博名为“深圳胖胖熊”的深圳儿童医院副院长麻晓鹏发微博表示 ...http://finance.sina.com.cn/chanjing/gsnews/2017-07-10/doc-ifyhweua4551056.shtml地图勾结莆田系医院 “连儿童都不放过”？百度：不存在任何售卖地图标注的商业行为大洋网-广州日报 刘幸、倪明广州日报讯 （全媒体记者刘幸、倪明）7月7日，微博名为“深圳胖胖熊”的深圳儿童医院副院长麻晓鹏发微博表示，“深圳市儿童医院地址本来在福田区益田路7019号，百度地图偏偏在它的地址搜索中把莆田系的远东妇儿医院的地址链接到深圳市儿童医院的名下，而且放到了第二位。导致许多想来我院看病的家长被误导到莆田系医院。”很快，网络上有关“百度地图再勾结莆田系医院，这次连儿童都不放过？”等帖子引起各界关注。是否故意引导患者至莆田系医院？从麻晓鹏这条微博的配图中可以看到，在百度地图中搜索“深圳市儿童医院”，第二条搜索结果的名字是“深圳市儿童医院”，但地址却是“深圳市-罗湖区-深南东路2097号”，查询可知这个地址属于莆田系的“远东妇儿医院“。也就是说，百度把要去深圳儿童医院看病的孩子家长，引导去了莆田系的医院。北京大学深圳医院妇产科副主任医师刘淼（微博名为淼哥故事会）也发文进行了声讨：真正坑的，就是那些刚来深圳的新人，或者病急乱投医的家长。这类人，生活拮据、信息闭塞，没什么影响力，即使被骗了，也人微言轻，投诉无门。截至昨日19时，深圳儿童医院副院长的原微博已获5600多次转发和1300多条评论。很多网友都在呼吁媒体跟进。有微博大V评论称，“百度地图和百度搜索一样，一切只为了钱服务，丝毫不在乎人的生命安全。百度地图这次居然连儿童都不放过。”有网友感慨，曾经的段子“百度无人汽车直接导航带你去莆田系医院”，很快就不是段子了。百度：百度地图标注免费昨日，百度官方发布了《关于“深圳市儿童医院”搜索结果误判的说明》（下称《说明》），百度表示，“日前，我们在微博上收到了一位深圳用户的报错，称在百度地图搜索‘深圳市儿童医院’关键词时，除正常搜索结果外，有一条结果错误指向

INFO:root:Scraping http://finance.sina.com.cn/stock/usstock/c/2017-07-09/doc-ifyhwehx5413913.shtml


用户搜公立医院被推荐莆田系医院 百度地图：误判2017-07-09中国新闻网近日，微博认证为深圳市儿童医院儿科医生的网友@深圳胖胖熊在微博上称，在百度地图搜索深圳市儿童医院，搜索结果却将莆田系的远东妇儿医院的地址链接到了下面，而且放到第二位，导 ...http://finance.sina.com.cn/roll/2017-07-09/doc-ifyhweua4512750.shtml中新经纬客户端7月9日电 近日，微博认证为深圳市儿童医院儿科医生的网友@深圳胖胖熊在微博上称，在百度地图搜索深圳市儿童医院，搜索结果却将莆田系的远东妇儿医院的地址链接到了下面，而且放到第二位，导致许多家长被误导。9日下午，百度地图回应称，属于医院的别名导致误判。网友@深圳胖胖熊微博截图网友@深圳胖胖熊微博截图网友@深圳胖胖熊微博截图7月9日下午，百度地图官方微博发布关于“深圳市儿童医院”搜索结果误判的说明，全文如下。责任编辑：马天元 SF180


INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-09/doc-ifyhwefp0289152.shtml


为什么腾讯阿里百度注册地都在加勒比海一岛2017-07-09中国新闻网1/36923的群岛。它的神奇之处在于，腾讯、阿里、百度、人人网、奇虎360……许多我们所熟知的互联网公司的注册地都在此――一个叫开曼群岛的地方。http://finance.sina.com.cn/stock/usstock/c/2017-07-09/doc-ifyhwehx5413913.shtml中新经纬客户端7月9日电 （李晓萱）加勒比海上，有一座总面积只有我国1/36923的群岛。它的神奇之处在于，腾讯、阿里、百度、人人网、奇虎360……许多我们所熟知的互联网公司的注册地都在此——一个叫开曼群岛的地方。“避税天堂”开曼群岛1503年，热衷于“环球旅行”的哥伦布在对新大陆的第四次探险时，发现了这座海岛。开曼群岛位于牙买加西北方268公里，迈阿密南方640公里的加勒比海上。由于正好位于墨西哥和古巴航线的中间，可以作为海盗中途停留休息的地方，所以经常被海盗用作基地，特别是17世纪80年代臭名昭著的黑胡子——爱德华•蒂奇。《加勒比海盗4惊涛怪浪》的反派海盗黑胡子也是以此为原型塑造的。目前开曼群岛是地属英国统治，但其在国内事务上享有更大程度的自主权。并且在1978年获得了一个皇家法令，法令规定永远豁免开曼群岛的缴税义务，故而，开曼群岛完全没有直接税收，无论是对个人、公司还是信托行业都不征任何直接税。所以，它也获得了“避税天堂”的美称。“避税天堂”，顾名思义这些注册在开曼的公司均属于离岸公司，也就是这类公司注册地在开曼但并不在这里开展实质业务。对于当地的政府来说，对这类公司没有任何税收，而只是象征性收取少量的年度管理费，更重要的是具有高度的保密性、减免税务负担、无外汇管制。如果企业需引入外资或海外上市，可通过在开曼群岛注册境外公司，对境内公司进行100%股权收购，然后将开曼公司提交中国香港或是美国上市来完成境内公司的海外融资。特别是对于互联网、教育以及传媒等在中国引进外资有限制的领域的行业，吸引力更大。这样，国内互联网公司选择设立离岸公司的原因就呼之欲出了。想去纳斯达克敲钟，开曼是中转站其实，开曼群岛早已成为中国企业一个重要“落户地”。从地产界的碧桂园、世茂地产，到运动品牌李宁、安踏，再到阿里巴巴、百度等互联网巨头，许多国人耳熟能详的公司，都是开曼群岛的注册企业。2015年1月，亚洲富豪李

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-07/doc-ifyhvyie0583313.shtml


李彦宏和陆奇的百度进化论2017-07-09经济观察报7月5日，11点59分，百度创始人、董事长兼首席执行官李彦宏乘坐无人驾驶汽车途径北京五环，总共走了15公里后，终于步上国家会议中心主题会议厅的演讲台，穿着印有百度LOGO的白色衬衣 ...http://finance.sina.com.cn/roll/2017-07-09/doc-ifyhwefp0289152.shtml7月5日，11点59分，百度创始人、董事长兼首席执行官李彦宏乘坐无人驾驶汽车途径北京五环，总共走了15公里后，终于步上国家会议中心主题会议厅的演讲台，穿着印有百度LOGO的白色衬衣，面带微笑。此时，早已进行完一轮开场演讲第二次上台的百度集团总裁兼首席运营官陆奇笑着问李彦宏：参加今天的开发者大会，你有什么感觉？“就看到黑压压的一片。”李彦宏笑了，说“也是，第一次举办开发者大会。”此次百度AI开发者大会参会人数达到4500人。据说有4000多人是开发者。这是百度面向全球推出的首届开发者大会。而李彦宏坐无人驾驶汽车来会场并和陆奇搭档出场的方式，无疑表明了AI在百度的重要层级。至此，或许如陆奇开场时所说，百度一定意义上已经不是一家互联网公司，它已经变成了一家人工智能企业。此次大会上，在李彦宏未到会场前，陆奇宣布了百度酝酿的重要计划：免费向行业开放两大平台，即DuerOS和Apollo。DuerOS是一款对话式人工智能系统，免费开放后，如玩具商、冰箱制造商可以在产品中嵌入DuerOS芯片，玩具、冰箱就可以和人对话。Apollo是自动驾驶技术系统，汽车厂商可以借助Apollo，搭建自己的自动驾驶汽车。随着两大平台的开放，百度新生态圈雏形已现。在去年底，李彦宏称，百度以前的生态没有了，要进化形成新的生态……两大开放平台7月5日上午10点，百度AI开发者大会开始，没有主持人，穿着T恤和牛仔裤的陆奇第一个上台，言语精炼，直奔主题，演讲时穿行在台上。加入百度半年，陆奇对百度的各项业务和未来规划都已经相当熟悉，他强调，“百度已经不是一家互联网公司，而是一家人工智能企业。”紧接着陆奇宣布了百度在人工智能领域6年来的成果——DuerOS和Apollo将免费开放给行业。 陆奇介绍，Apollo1.0开放平台完整的技术架构包括软件平台、云端服务平台、参考硬件平台、参考车辆平台四大部分，通过四层架构全方位构建能够实际

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-07/doc-ifyhweua4334954.shtml


百度无人车上路引争议 智能汽车行业专家：未来应出台相关法规2017-07-07中国新闻网研讨会在京召开。期间，针对近日百度无人驾驶汽车上路引来的争议，智能汽车行业专家、柒壹资本创始合伙人甄爱武在接受中新经纬(微信公众号：jwview)采访时如此表示。http://finance.sina.com.cn/roll/2017-07-07/doc-ifyhvyie0583313.shtml中新经纬客户端7月7日电(常涛)“任何新生事物在得到认可之前都会引发争议，无人驾驶也不例外。虽然目前此领域在法律法规上属于空白，但随着时间的推移，政府管理部门、行业组织和企业之间一定会达成默契和规范，出台相应的法规。”7月7日，由网秦主办的“智能汽车平台服务暨内核安全增强应用”研讨会在京召开。期间，针对近日百度无人驾驶汽车上路引来的争议，智能汽车行业专家、柒壹资本创始合伙人甄爱武在接受中新经纬(微信公众号：jwview)采访时如此表示。智能汽车行业专家、柒壹资本创始合伙人甄爱武 中新经纬 常涛 摄前天(5日)，互联网领域的大佬李彦宏刷爆了朋友圈，他乘坐着无人驾驶汽车在五环上“任性”行驶，引来了一场无形的“指责”。昨日，北京交警发布通报称，对百度无人车高度重视，正开展积极调查核实。北京交警称，公安交管部门支持无人驾驶技术创新，但应当依法、安全、科学进行。甄爱武表示，智能汽车被认为是下一个堪比手机的移动端，它对人类生活方式和社会运行秩序的影响将是颠覆性。但具体会带来什么，他表示业界目前还没有形成定论。但可以肯定的是，这些改变首先会在行业内产生，比如在城市公交系统内。“至于对老百姓生活的影响，那无疑是更便利了。”他说。谈到智能交通与智能汽车的关系时，甄爱武对中新经纬客户端(微信公众号：jwview)表示，目前的智能汽车都是单车智能，没有车车之间、车路之间、车和交通管理后台之间的互联，他表示未来一定会产生关联，将来的智能汽车会逐渐从单车智能向车联网的方向发展，而且这条路会走得很快。甄爱武表示，包括乐视在内的一些互联网企业布局智能汽车是无可厚非的，任何企业只要有能力都可以做。但需要注意的一个问题是，相比于生产制造手机和PC，智能汽车要难得多。因为对智能汽车来说，无论是驾驶安全，还是装备集成方面，要求都很高。“一辆车从设计到上路，到真正的批量交付，没有几年的时间是不可能的。特斯拉经历了十年

INFO:root:Scraping http://finance.sina.com.cn/chanjing/gsnews/2017-07-07/doc-ifyhvyie0434953.shtml


错失移动互联时代后 百度急需验证AI变现能力2017-07-07华夏时报华夏时报（公众号：chinatimes）记者 卢晓 北京报道“百度将All in AI（人工智能），我们在AI时代的核心战略就是开放赋能，我们的将来必须建立在与每个开发者共赢的基础上。http://finance.sina.com.cn/roll/2017-07-07/doc-ifyhweua4334954.shtml华夏时报（公众号：chinatimes）记者 卢晓 北京报道“百度将All in AI（人工智能），我们在AI时代的核心战略就是开放赋能，我们的将来必须建立在与每个开发者共赢的基础上。” 7月5日，百度董事会副主席、集团总裁兼COO陆奇在百度AI开发者大会（Baidu Create 2017）上对《华夏时报（公众号：chinatimes）》记者等媒体如是说。ALL IN （全押）显示了百度在AI上的投入决心。在错失移动互联网时代后，人工智能被百度看做翻盘的机会。但人工智能的商业化变现依旧是百度面前绕不过去的问题。搜索之外的世界百度试图向外界展示自己除了搜索之外的世界。7月5日，百度首次对外公布了完整的AI生态开放战略。除了发布DuerOS和Apollo两大开放平台外，百度还宣布百度大脑和百度智能云将为包括金融、教育、医疗、出行等多个行业提供开发工具和有效的AI行业解决方案。百度宣布，其已开放60项AI核心能力，含此次首次开放的14项新能力。百度将大量的精力花费在操作系统上。对话式人工智能系统DuerOS平台在当天被宣布开放。百度度秘事业部总经理景鲲将之称作人工智能时代的安卓系统。而在7月5日当天，百度还宣布将全资收购人工智能初创公司KITT.AI。Apollo开放平台是百度开放的又一操作系统。陆奇将之称作自动驾驶的安卓系统。2017年4月，百度公布“Apollo计划”，开放自己的无人驾驶技术。而陆奇在当天除了宣布Apollo开放平台首期将开放Apollo 1.0封闭园区自动驾驶能力外，还完整披露了Apollo开放平台的具体开放细节和路径图。DuerOS和Apollo可以看做是陆奇空降百度后主抓的两大重要成果。今年2月，陆奇发出通告，宣布自即日起将原度秘团队升级为度秘事业部，直接向其汇报，以加速人工智能布局，及其产品化和市场化。而在今年3月，陆奇也整合原有的自动驾驶事业部（

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4117590.shtml


百度无人车上路直播引发质疑 国内法律尚处空白2017-07-07新浪综合百度无人车上路 交管介入调查 来源：北京晨报 前天百度AI开发者大会上，百度公司首席执行官李彦宏通过视频直播展示了一段自己乘坐百度无人车的情景（如图）。http://finance.sina.com.cn/chanjing/gsnews/2017-07-07/doc-ifyhvyie0434953.shtml百度无人车上路 交管介入调查来源：北京晨报前天百度AI开发者大会上，百度公司首席执行官李彦宏通过视频直播展示了一段自己乘坐百度无人车的情景（如图）。这段视频被上传到网络后，引起了网友热议。随后便有人质疑无人驾驶已经涉嫌违反《道路交通安全法》，但也有人认为应当给无人驾驶以一定的试验空间。昨天，北京市交管部门表示正在对此事进行调查，交管部门支持无人驾驶技术创新，但应当在依法、安全、科学的前提下进行。争议：无人车上路直播引发质疑在这段约1分钟的视频中，李彦宏通过直播方式在会场大屏幕展示了正在研发的无人驾驶汽车。北京晨报记者在视频中看到一辆红色的轿车在路面上驰骋，李彦宏说：“车开得很平稳，感觉非常不错。”并表示“前面的屏幕可以展示自动驾驶的汽车探索的周边情况，有哪些障碍物需要躲避”。视频被放到网上后，便有网友提出，我国目前尚未允许无人驾驶汽车上路，因此质疑该车上路行驶涉嫌违法。还有“眼尖”的网友注意到，视频中的车辆除了有“轧实线”的违法行为，由于该车悬挂的是尾号为E的江苏牌照，因此还涉嫌违反北京地区的限行规定。而根据上述违法情节，按规定将面临200元罚款、扣2分和100元罚款的处罚。针对“百度公司无人驾驶汽车上道路行驶”一事，北京市交管部门高度重视，昨天表示正在就此事积极开展调查核实。并表态交管部门支持无人驾驶技术创新，但应当依法、安全、科学进行。对于违反《道路交通安全法》等法律法规的行为，交管部门将依法予以查处。现状：国内法律尚处空白无论是我国《道路交通安全法》还是《道路交通安全法实施条例》中，对于驾驶者的定义均为“人”，只有“符合国务院公安部门规定的驾驶许可条件”的人，才可以申请机动车驾驶证，并须在取得机动车驾驶证后依法上路。而对于无人驾驶，目前我国法律中尚未作出相关规定。北京晨报记者注意到，李彦宏其实早就对无人驾驶的合法化有过建议。李彦宏曾提出，当前一些发达国家都已采取多种措施支持企

INFO:root:Scraping http://finance.sina.com.cn/stock/t/2017-07-06/doc-ifyhvyie0355368.shtml


百度AI核心技术全面开放 与开发者共享AI未来2017-07-06新华网7月5日，百度AI开发者大会在北京举行，在“开放创新 共襄AI未来”为主题的AI技术与开放平台分论坛上，百度副总裁、百度AI技术与平台体系（AIG）总负责人王海峰表示，百度几乎所有主要人 ...http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4117590.shtml7月5日，百度AI开发者大会在北京举行，在“开放创新 共襄AI未来”为主题的AI技术与开放平台分论坛上，百度副总裁、百度AI技术与平台体系（AIG）总负责人王海峰表示，百度几乎所有主要人工智能技术都已在搜索引擎中得到应用，来自搜索引擎及百度各产品的用户需求、数据和平台，支撑了百度AI技术的快速发展，现在百度人工智能在算法、数据、技术等方面具有领先优势。“在每天数十亿次用户请求的千锤百炼下，百度的人工智能技术，是真正实用的人工智能技术，”王海峰认为，只有将技术与实际应用相结合，根据用户需求和反馈反复迭代优化，才能打造强大、更具活力的AI技术。据悉，百度的AI能力分为4层：在基础层，是AI算法、大数据、大计算能力；感知层，包括语音、图像、视频、AR/VR等技术；认知层，有自然语言处理、知识图谱及用户画像等；在平台层，基础层、感知层、认知层的技术会平台化，通过百度AI开放平台ai.baidu.com开放，与开发者共享。此次宣布开放的语音、自然语言处理、视频、增强现实、机器人视觉等技术，与已经开放的AI技术一起，构成具有60项开放技术的完整的、综合的AI开放平台，为开发者提供形式多样、可定制、可组合的AI技术，满足开发者从API、源码、数据到计算能力的多层次需求。数据显示，百度AI开放平台多项技术的使用量过去半年有2倍以上的增长。语音交互成为人机交互的下一代入口，语音技术需求日益增加。百度语音技术部总监高亮在分论坛现场介绍了本次新开放的远场识别及语音唤醒、定制化语音合成、语音合成音色、 情感语音交互（Emotional CUI）等技术，开发者可以实现不同场景的智能应用，满足用户需求。百度在开放语音技术，让机器听清用户的同时，更重要的是开放能让机器懂得用户需求的自然语言处理技术。此次分论坛由百度自然语言处理部总监赵世奇介绍了能力强大的语言理解与交互技术平台——UNIT。该

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4090493.shtml


中科创达：将在智能驾驶和车联网等方向与百度合作2017-07-06中国证券网中国证券网讯 中科创达在投资者互动平台上表示，公司将与百度展开多维度的深入合作。公司介绍，基于百度提供的智能驾驶基础平台，中科创达将会在智能驾驶和车联网等方向与百度展开 ...http://finance.sina.com.cn/stock/t/2017-07-06/doc-ifyhvyie0355368.shtml中国证券网讯 中科创达在投资者互动平台上表示，公司将与百度展开多维度的深入合作。公司介绍，基于百度提供的智能驾驶基础平台，中科创达将会在智能驾驶和车联网等方向与百度展开合作设计与开发，共同加快车厂的智能化进程。双方合作将涉及到MapAuto、DuerOS、CarLife等智能联网解决方案。进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/manage/crz/2017-07-06/doc-ifyhwefp0139904.shtml


北京交管部门：正对“百度无人驾驶汽车上道路行驶”开展调查核实2017-07-06新华网新华社北京７月６日电（记者卢国强）北京交管部门６日表示，针对“百度公司无人驾驶汽车上道路行驶”情况，交管部门正在积极开展调查核实，对于违法行为将依法查处。记者从北京 ...http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4090493.shtml新华社北京７月６日电（记者卢国强）北京交管部门６日表示，针对“百度公司无人驾驶汽车上道路行驶”情况，交管部门正在积极开展调查核实，对于违法行为将依法查处。记者从北京市公安交管局了解到，针对媒体报道“百度公司无人驾驶汽车上道路行驶”的情况，北京市公安交管部门高度重视，正在积极开展调查核实。交管部门表示支持无人驾驶技术创新，但应当依法、安全、科学进行。对于违反《中华人民共和国道路交通安全法》等法律法规的行为，公安交管部门将依法予以查处。媒体报道，５日上午的“２０１７百度ＡＩ开发者大会”上，百度董事长兼首席执行官李彦宏通过视频展示他乘坐百度无人驾驶汽车的影像，并称车辆正行驶在北京五环路上，引发“无人驾驶汽车上路是否合法”等争议。进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4087301.shtml


百度眼看要掉队BAT 李彦宏是如何裹足不前的？2017-07-06新浪综合每天都要被对手黑，每分每秒都有股价波动……这还不算不定期爆炸的公关危机、网友举报。百度CEO李彦宏最近体会尤其深。http://finance.sina.com.cn/manage/crz/2017-07-06/doc-ifyhwefp0139904.shtml眼看要掉队BAT，李彦宏是怎么flop的？来源：微信公众号 环球人物做大咖难，做互联网大咖尤其难。每季度都有财报会，每月都有新趋势，每礼拜都有新技术，每天都要被对手黑，每分每秒都有股价波动……这还不算不定期爆炸的公关危机、网友举报。百度CEO李彦宏最近体会尤其深。PPT错字事件还历历在目，昨天的百度AI开发者大会，彦宏兄刚喜滋滋地公布了自己坐着百度无人驾驶汽车上五环的视频，交警就发来“贺电”：朋友，你这种操作不对啊！好了，本着开一次发布会红一次的节奏，彦宏兄不经意间，又红了。“all in人工智能”的口号还没喊出，一个急刹车搡得彦宏兄大喜转小悲。很多年前李彦宏就说过，百度离破产永远只有30天。而现在，更是每一天都面临着市值被京东超过，从中国互联网天团BAT出局的风险。就算不出局，百度在BAT里也早就低人一头了。咱先不看产品和口碑，只看市值，阿里和腾讯已经超过3000亿美金，百度的600多亿，才是人家的1/5。时光倒退5年，李彦宏的人设还是如假包换的真·人生赢家。当年的市高考状元，北大信息管理专业毕业，读过美国名校，做过硅谷精英，2000年创立百度，2005年纳斯达克上市，6年后被福布斯评为中国内地首富。再加上有颜有身材，他本来能完爆骨骼清奇的马云和靠山寨起家的马化腾。谁也没想到，这几年，李彦宏能flop得这么快。更让人唏嘘的是，没几个人为他抱不平，最多只会惋惜地说一句：没想到你李彦宏浓眉大眼的也有今天。吃瓜群众对李彦宏本人倒是没啥意见，主要的黑点都在百度身上。2010年谷歌退出中国，百度一家独大，从此被扣上了胜之不武的帽子，还成了许多阴谋论的主角。更让人不齿的是，百度搜索不但要钱，还要命。去年的魏则西事件、卖贴吧事件，幕后真凶都是百度最大的金主爸爸莆田系医院，这样助纣为虐当然人人喊打。面子已经崩盘，里子呢？圈内人提起百度也是频频摇头。这市值总上不去，不是没有原因的。首先，收入来源太单一。腾讯有手游有社交，阿里有电商有娱乐，百度

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhvyie0329858.shtml


百度Create 2017：AI核心技术全面开放 与开发者共享AI未来2017-07-06中国新闻网中新网7月6日电？真正能给用户带来价值的技术，才会有真正持久的影响力。7月5日，百度AI开发者大会(Baidu Create 2017)在北京国家会议中心举行，其中以“开放创新 共襄AI未来”为主题的AI技 ...http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4087301.shtml中新网7月6日电  真正能给用户带来价值的技术，才会有真正持久的影响力。7月5日，百度AI开发者大会(Baidu Create 2017)在北京国家会议中心举行，其中以“开放创新 共襄AI未来”为主题的AI技术与开放平台分论坛，吸引了众多开发者关注。百度副总裁、百度AI技术与平台体系(AIG)总负责人王海峰在开场致辞中表示，百度在人工智能领域深耕多年，从十七年前百度诞生之日起就开始积累，几乎所有主要人工智能技术都已在百度搜索引擎中得到应用，来自搜索引擎及百度各产品的用户需求、数据和平台，支撑了百度AI技术的快速发展，现在百度人工智能在算法、数据、技术等方面具有领先优势。“在每天数十亿次用户请求的千锤百炼下，百度的人工智能技术，是真正实用的人工智能技术，”王海峰认为，只有将技术与实际应用相结合，根据用户需求和反馈反复迭代优化，才能打造强大、更具活力的AI技术。百度诞生于PC互联网时代，那是一个开放互联网生态的时代。在互联网的助力下得到迅速发展的AI技术，也应该秉承开放精神。更重要的是，AI的影响将不限于互联网，AI将影响各行各业和人们生活的方方面面。百度通过与开发者和社会共享AI技术成果，带动生态繁荣，推动社会进步。此次，百度多年打造的完整AI技术平台将全面开放。百度的AI能力分为4层。在基础层，是AI算法、大数据、大计算能力。感知层，包括语音、图像、视频、AR/VR等技术。认知层，有自然语言处理、知识图谱及用户画像等。在平台层，基础层、感知层、认知层的技术会平台化，通过百度AI开放平台ai.baidu.com开放，与开发者共享。开放的技术能力总共有60个，是最全面的AI技术开放平台。60项开放技术打造能力完整、组合丰富的开放平台百度AI开放平台在完整性、开放性、前瞻性和发展性方面均领跑业界。此次宣布开放的语音、自然

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4081228.shtml


警方回应百度无人车上道路行驶：支持创新但违法必究2017-07-0621世纪经济报道视频：昨日（7月5日），百度公司董事长兼CEO李彦宏通过视频直播，展示自己乘坐公司研发的无人驾驶汽车的情景。http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhvyie0329858.shtml视频：昨日（7月5日），百度公司董事长兼CEO李彦宏通过视频直播，展示自己乘坐公司研发的无人驾驶汽车的情景。当天北京交管部门回应，现行法规不允许无人驾驶上路，正在就此展开调查。7月6日北京交警官方微博对事件进行公开回应称，针对媒体报道“百度公司无人驾驶汽车上道路行驶”的情况，市公安交管部门高度重视，正在积极开展调查核实。公安交管部门支持无人驾驶技术创新，但应当依法、安全、科学进行。对于违反《中华人民共和国道路交通安全法》等法律法规的行为，公安交管部门将依法予以查处。来源：综合北京交警微博、新浪科技进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhvyie0319481.shtml


[互动]中科创达：将在智能驾驶和车联网等方向与百度合作2017-07-06全景网全景网7月6日讯？？中科创达(300496)周三在全景网投资者互动平台上回答投资者提问时表示，公司将与百度展开多维度的深入合作。http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4081228.shtml全景网7月6日讯   中科创达(300496)周三在全景网投资者互动平台上回答投资者提问时表示，公司将与百度展开多维度的深入合作。公司介绍，基于百度提供的智能驾驶基础平台，中科创达将会在智能驾驶和车联网等方向与百度展开合作设计与开发，共同加快车厂的智能化进程。双方合作将涉及到MapAuto、DuerOS、CarLife等智能联网解决方案。针对投资者关于公司与百度合作情况的询问，中科创达作出上述回复。（全景网）进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/chanjing/gsnews/2017-07-06/doc-ifyhwefp0126364.shtml


北京警方：正对百度无人驾驶车上路行驶展开调查核实2017-07-06中国证券网中国证券网讯 6日，北京交警官方微博发布《情况通报》，称对媒体报道“百度公司无人驾驶汽车上道路行驶”的情况高度重视，正在积极开展调查核实。http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhvyie0319481.shtml中国证券网讯 6日，北京交警官方微博发布《情况通报》，称对媒体报道“百度公司无人驾驶汽车上道路行驶”的情况高度重视，正在积极开展调查核实。公安交管部门支持无人驾驶技术创新，但应当依法、安全、科学进行。对于违反《交通安全法》等法律法规的行为，将依法予以查处。进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhvyie0317072.shtml


北京交警回应百度无人驾驶汽车上道路行驶：正核实2017-07-06新浪财经新浪财经讯 7月6日消息，对于媒体报道的百度公司无人驾驶汽车上道路行驶的情况，北京交警官方微博最新通报称，正在积极开展调查核实。通报中称公安交管部门支持无人驾驶技术创新 ...http://finance.sina.com.cn/chanjing/gsnews/2017-07-06/doc-ifyhwefp0126364.shtml新浪财经讯 7月6日消息，对于媒体报道的百度公司无人驾驶汽车上道路行驶的情况，北京交警官方微博最新通报称，正在积极开展调查核实。通报中称公安交管部门支持无人驾驶技术创新，但应当依法、安全、科学进行。对于违法违规行为将依法予以查处。7月5日，百度AI开发者大会2017在北京国家会议中心召开。会上，百度董事会副主席、集团总裁兼首席运营官陆奇在介绍百度无人驾驶平台Apollo时，与正在前往会场的百度创始人、董事长兼首席执行官李彦宏连线。据介绍，李彦宏当时乘坐的正是通过Apollo平台生产的无人驾驶汽车。这段连线视频一经播出立即引发了各界激烈的讨论，很多网友表示该视频就是百度公然违反现行《道路交通安全法》的直接证据。进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/stock/hyyj/2017-07-06/doc-ifyhwefp0119243.shtml


百度正式发布自动驾驶Apollo计划 无人驾驶概念股活跃2017-07-06中国网财经7月6日讯 受百度正式发布自动驾驶Apollo计划利好消息影响，无人驾驶概念股早盘，截至发稿，路畅科技两连板，万安科技涨逾5%，长城汽车、华域汽车均有不同程度涨幅。http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhvyie0317072.shtml中国网财经7月6日讯 受百度正式发布自动驾驶Apollo计划利好消息影响，无人驾驶概念股早盘，截至发稿，路畅科技两连板，万安科技涨逾5%，长城汽车、华域汽车均有不同程度涨幅。消息面上，7月5日，百度AI开发者大会在北京召开，其全力打造的Apollo自动驾驶开放平台成为现场最具人气的热点。从今年4月份百度首次公布Apollo至今，Apollo的“季报”备受期待。在当日上午召开的主论坛上，百度总裁兼首席运营官陆奇详细解读了Apollo整体战略和开放路线图，并宣布百度自动驾驶系统Apollo生态正式诞生。值得一提的是，陆奇在演讲中将该生态的“朋友圈”名单打到了身后的大屏幕上，包括戴姆勒、福特两家国际车企以及东风、长安等13家中国车企，此外，还包括产业链上一流的芯片公司、传感器公司、地图公司、云服务公司、研究机构等，如微软、intel 、路畅科技、中兴通讯、清华大学等。据陆奇透露，初始合作伙伴已经超过50个，“毫无疑问，Apollo是今天整个汽车工业最强大的自动驾驶生态。”进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhvyie0308019.shtml


阿里百度“竞技”人工智能 多家上市公司回应是否涉足2017-07-06e公司e公司讯，7月5日，百度公布自动驾驶阿波罗计划，阿里也正式发布语音音箱产品，声纹支付购物功能亮相。7月5日晚间至6日，多家公司被问及是否涉足阿里百度的产业。http://finance.sina.com.cn/stock/hyyj/2017-07-06/doc-ifyhwefp0119243.shtmle公司讯，7月5日，百度公布自动驾驶阿波罗计划，阿里也正式发布语音音箱产品，声纹支付购物功能亮相。7月5日晚间至6日，多家公司被问及是否涉足阿里百度的产业。其中，水晶光电称公司的生物识别滤光片产品，可广泛应用于手势、虹膜及人脸识别领域；启明信息称日前公司与百度刚签合作协议，但目前具体细节尚未确定；移为通信称公司产品应用于无人驾驶上不存在技术问题；路畅科技称在无人驾驶领域深耕已久，技术储备和产品紧跟最新发展。进入【新浪财经股吧】讨论


INFO:root:Scraping http://finance.sina.com.cn/stock/hyyj/2017-07-06/doc-ifyhwefp0109588.shtml


百度打造开放式AI生态 开发者追捧与疑虑并存2017-07-0621世纪经济报道7月5日早上9点，距离2017百度开发者大会正式开始还有1个小时的时间，大会现场展台区已人头攒动。大会正式开始后，不仅会场坐席爆满，在会场偏后的看台区域，也有很多找不到座位、直 ...http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhvyie0308019.shtml7月5日早上9点，距离2017百度开发者大会正式开始还有1个小时的时间，大会现场展台区已人头攒动。大会正式开始后，不仅会场坐席爆满，在会场偏后的看台区域，也有很多找不到座位、直接坐在台阶上的参会者。推动开发者们热情高涨的，是百度的人工智能开放平台计划。在过去，包括谷歌、微软、苹果、Facebook等科技巨头每年均召开一次开发者大会，将自身的技术实力，尤其是近年来爆红的人工智能技术全面赋能全球开发者。在国内，2017百度开发者大会尚属首例。“AI的未来属于开发者，百度的将来必须建立在每个开发者共赢的基础上。”在大会现场，百度集团总裁兼COO陆奇表示，“AI时代机会极多，但开发壁垒同样很高，百度希望为每一位AI开发者解除障碍，提供工具、数据、基础设施以及良好的开发环境。”对于开发者而言，如何将原本需要数月时间的新车型移植及整车测试，压缩在三天内完成？如何用1分钟的时间，让原本只会英文语音交互的音箱，马上变得能够听懂中国话？答案很简单：借势。而百度正在试图与其他科技巨头一样，将自己所具备的人工智能之“势”，赋予相关的开发者。“百度AI生态战略的方向，是建立和引领新一代的AI计算平台，通过将DuerOS、阿波罗平台、百度大脑和百度智能云等综合在一起，形成一个强大的AI生态。”陆奇指出。其中，对话式人工智能系统和自动驾驶两大领域的开放计划，成为本次百度开发者大会的关注重心。所谓对话式人工智能系统，即DuerOS系统，百度将此系统能力进行开放后，开发者能够在基础技术框架上构建匹配自身需求的语音交互系统，并搭载到相应的智能硬件上。据百度度秘事业部总经理景鲲介绍，DuerOS开放平台运用了最先进的自然语言处理技术，赋予机器听清、听懂人类语言的能力，为用户提供最自然的人机交互体验。与此同时，考虑到AI时代呈现出软硬结合的趋势，但目前软硬结合的开发成本较高，因此DuerOS还将为开发

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhwefp0106577.shtml


路畅科技等多家公司加入百度无人驾驶生态联盟2017-07-06中国证券报-中证网7月5日举行的“百度AI开发者大会”上，百度宣布将推出DuerOS和Apollo两大开放平台。前者为对话式人工智能系统开放平台，具备先进的自然语言处理技术，赋予机器听懂人类语言的能力；后 ...http://finance.sina.com.cn/stock/hyyj/2017-07-06/doc-ifyhwefp0109588.shtml7月5日举行的“百度AI开发者大会”上，百度宣布将推出DuerOS和Apollo两大开放平台。前者为对话式人工智能系统开放平台，具备先进的自然语言处理技术，赋予机器听懂人类语言的能力；后者旨在提供开放、完整、安全的软硬件和服务平台，帮助开发者快速搭建自动驾驶系统。长安汽车、长城汽车、江淮汽车、中兴通讯、路畅科技等多家公司入围Apollo生态合作伙伴联盟。受此影响，7月5日，无人驾驶概念板块集体大涨。两大开放平台据介绍，对话式人工智能系统DuerOS已经与百余家家电、芯片和服务提供商建立了生态合作关系，以技术和产业优势领跑市场。百度度秘事业部总经理景鲲介绍，DuerOS开放平台运用了先进的自然语言处理技术，赋予机器听清、听懂人类语言的能力，为用户提供最自然的人机交互体验。为了更好地实现通过对话式人工智能系统“唤醒万物”，百度将全资收购KITT.AI，更大限度地开放技术能力满足智能语音设备开发者的需求。Apollo则是另一重要开放平台。2017年4月，百度董事会副主席、集团总裁兼COO陆奇在上海车展期间宣布Apollo计划，将开放自动驾驶平台。Apollo也是全球范围内自动驾驶技术的第一次系统级开放，旨在提供开放、完整、安全的软硬件和服务平台，帮助开发者快速搭建属于自动驾驶系统。DuerOS与Apollo两大开放平台都运用了百度大脑的核心能力。陆奇指出，百度已构建包含算法层、感知层、认知层和平台层技术架构的AI技术平台，百度大脑将全面开放60项核心AI能力，其中包括语音、视频、增强现实、机器人视觉、自然语音处理五大类14项新能力。多家公司入围在DuerOS与Apollo两大开放平台中，Apollo尤其受到市场关注。在7月5日的百度AI开发者大会上，百度公布了Apollo详细的路线图、技术框架以及首期开放的能力，并发布Apollo生态合作伙伴联盟，

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4040601.shtml


百度首次公布AI生态战略：无人驾驶开发时间仅用三天2017-07-06第一财经日报李彦宏乘无人车上五环 百度自动驾驶的两年和三天 刘佳 7月5日上午11点，北京五环路上车流拥挤，一辆行驶中的红色商务车看上去并没有什么特别。http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhwefp0106577.shtml李彦宏乘无人车上五环 百度自动驾驶的两年和三天刘佳7月5日上午11点，北京五环路上车流拥挤，一辆行驶中的红色商务车看上去并没有什么特别。当时，百度创始人李彦宏正坐在副驾驶上，主驾驶位的司机双手未触碰方向盘，双脚离开油门刹车区域，车辆正在自动驾驶中。“现在车非常多，但是还是很平稳，感觉非常不错。前面也有一个屏幕可以展示出来自动驾驶汽车探索的周边的情况，我们的车处在自动驾驶的状态。”视频连线中，李彦宏和几公里外百度AI开发者大会现场的百度集团总裁陆奇分享了实时体验。当外界还在因为互联网格局变化议论纷纷时，百度正在用一次“把无人车开上五环”、“把智能驾驶能力开放出来”的行动，撕下过去“搜索公司”的标签，告诉外界：百度已经不再是一家互联网公司，它正在AllinAI。Allin人工智能这是百度第一次对外公布完整的AI生态开放战略。“AI将和前三次工业革命一样，让人类进入全新的时代。”陆奇这样说。在他看来，只做硬件或者软件都是不够的，AI技术与其他技术的不同之处，在于数据起到了重要而特殊的作用，必须系统加数据、通过学习、训练才能获得能力。“这次人工智能革命的本质是一场知识的革命，是快速、自动地来获取知识。”百度公布的AI开放生态战略包括：前端的对话式人工智能系统DuerOS和自动驾驶Apollo开放平台，以及后端的百度大脑和智能云。其中，DuerOS与Apollo开放平台都运用了百度大脑的核心能力。陆奇指出，百度已构建包含算法层、感知层、认知层和平台层技术架构的AI技术平台，并宣布百度大脑将全面开放60项核心AI能力，其中包括语音、视频、增强现实、机器人视觉、自然语音处理五大类14项新能力。在陆奇看来，中国科技公司在AI时代有着很大的优势。因为现在全世界有43%人工智能论文是华人撰写的，中国有足够大的技术累积，此外，中国的互联网公司在AI核心技术有了早期的着陆和长期的研发，有大量的资金，有世界上最大、最活跃的用户群，

INFO:root:Scraping http://finance.sina.com.cn/chanjing/gsnews/2017-07-06/doc-ifyhvyie0284926.shtml


百度打造开放式AI生态 开发者对如何盈利存疑虑2017-07-0621世纪经济报道百度打造开放式AI生态 开发者追捧与疑虑并存 本报记者 杨清清 北京报道 导读 科技巨头之所以开源技术、免费共享，是因为当前技术虽然领先但不够成熟，需要更多的人来参与推动。http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhweua4040601.shtml百度打造开放式AI生态 开发者追捧与疑虑并存本报记者 杨清清 北京报道导读科技巨头之所以开源技术、免费共享，是因为当前技术虽然领先但不够成熟，需要更多的人来参与推动。7月5日早上9点，距离2017百度开发者大会正式开始还有1个小时的时间，大会现场展台区已人头攒动。大会正式开始后，不仅会场坐席爆满，在会场偏后的看台区域，也有很多找不到座位、直接坐在台阶上的参会者。推动开发者们热情高涨的，是百度的人工智能开放平台计划。在过去，包括谷歌、微软、苹果、Facebook等科技巨头每年均召开一次开发者大会，将自身的技术实力，尤其是近年来爆红的人工智能技术全面赋能全球开发者。在国内，2017百度开发者大会尚属首例。“AI的未来属于开发者，百度的将来必须建立在每个开发者共赢的基础上。”在大会现场，百度集团总裁兼COO陆奇表示，“AI时代机会极多，但开发壁垒同样很高，百度希望为每一位AI开发者解除障碍，提供工具、数据、基础设施以及良好的开发环境。”打造AI生态对于开发者而言，如何将原本需要数月时间的新车型移植及整车测试，压缩在三天内完成？如何用1分钟的时间，让原本只会英文语音交互的音箱，马上变得能够听懂中国话？答案很简单：借势。而百度正在试图与其他科技巨头一样，将自己所具备的人工智能之“势”，赋予相关的开发者。“百度AI生态战略的方向，是建立和引领新一代的AI计算平台，通过将DuerOS、阿波罗平台、百度大脑和百度智能云等综合在一起，形成一个强大的AI生态。”陆奇指出。其中，对话式人工智能系统和自动驾驶两大领域的开放计划，成为本次百度开发者大会的关注重心。所谓对话式人工智能系统，即DuerOS系统，百度将此系统能力进行开放后，开发者能够在基础技术框架上构建匹配自身需求的语音交互系统，并搭载到相应的智能硬件上。据百度度秘事业部总经理景鲲介绍，DuerOS开放平台运用了最先进的自然语言处理技术，

INFO:root:Scraping http://finance.sina.com.cn/roll/2017-07-06/doc-ifyhvyie0279853.shtml


百度无人驾驶汽车直播中压实线变道 该罚李彦宏吗？2017-07-06大洋网-广州日报百度视频展示无人驾驶汽车 不打转向灯 压实线变道 引交管部门介入调查 无人驾驶违章 该罚李彦宏吗？大洋网-广州日报 邓莉 昨日的2017百度AI开发者大会上，百度董事长兼首席执行官李彦宏 ...http://finance.sina.com.cn/chanjing/gsnews/2017-07-06/doc-ifyhvyie0284926.shtml百度视频展示无人驾驶汽车 不打转向灯 压实线变道 引交管部门介入调查无人驾驶违章 该罚李彦宏吗？大洋网-广州日报 邓莉昨日的2017百度AI开发者大会上，百度董事长兼首席执行官李彦宏通过视频直播展示了一段自己乘坐公司研发的无人驾驶汽车的情景。视频中，李彦宏坐在一辆红色汽车的副驾驶位上，他称自己刚刚上五环，正在前往会场的路上，“车处在自动驾驶的状态”，整段视频约1分钟长。 @视觉中国文/广州日报全媒体记者邓莉以互联网搜索引擎起家的百度，当前一个重要的发展方向是AI与无人驾驶汽车。昨日，在百度AI开发者大会上，百度创始人、董事长兼首席执行官李彦宏通过视频直播展示了一段自己乘坐百度研发的无人驾驶汽车的情景。不过，这本应是一次尖端技术演示，却引发了一场争议——细心的网友通过视频发现，这辆无人驾驶的车辆在“众目睽睽”之下违规了，随后北京交警表示将介入调查，那么问题来了：在司机没有驾驶的情况下违章，该罚谁？无人驾驶汽车直播中压实线变道广州日报全媒体记者查看该场发布会的回顾视频时留意到，在让现场无数人为之鼓掌的视频连线中，李彦宏坐在副驾驶位，驾驶员全程不碰方向盘，汽车自动行驶，顺利开上了北京的北五环，此时车辆在画有实线的路段并到另一车道，同时也没有打转向灯。这段视频画面被网友转发后迅速发酵，随后北京交管局也表示已经获悉相关情况，正在就此展开调查。在交管部门未公布调查结果之前，昨天下午，百度对外补充解释道，李彦宏所乘坐的无人驾驶汽车，驾驶位有人乘坐，为百度智能汽车事业部总经理顾维灏，而顾维灏全程也未用双手触碰方向盘。关于百度这辆无人驾驶汽车的违章问题，业内争议焦点在于：无人驾驶汽车该不该配备驾驶员？驾驶员需要什么资质？百度这辆演示车的违章情况，该处罚谁？无人驾驶处罚成难题？默认规则看“车辆控制权”如果是一辆由驾驶员正常驾驶的汽车实线变道，依据《

# Web Crawling with `Scrapy`

One of the challenges of writing web crawlers is that you’re often performing the same tasks again and again: find all links on a page, evaluate the difference between internal and external links, go to new pages. These basic patterns are useful to know and to be able to write from scratch, but the Scrapy library handles many of these details for you.

##  Installing Scrapy

- After Anaconda is installed, you can install Scrapy by using this command:
   
      conda install -c conda-forge scrapy



## Dealing with Different Website Layouts

Fortunately, in most cases of web crawling, you’re not looking to collect data from sites you’ve never seen before, but from a few, or a few dozen, websites that are pre-selected by a human. This means that you don’t need to use complicated algorithms or machine learning to detect which text on the page “looks most like a title” or which is probably the “main content.” You can determine what these elements are manually.

The most obvious approach is to write a separate web crawler or page parser for each website. Each might take in a URL, string, or BeautifulSoup object, and return a Python object for the thing that was scraped.


## Initializing a New Spider

To create a new spider in the current directory, run the following from the **command line (NOT THE PYTHON PROMPT)**:
```
    scrapy startproject wikiSpider
```    
    
This creates a new subdirectory in the directory the project was created in, with the title wikiSpider. Inside this directory is the following file structure:

- scrapy.cfg
- wikiSpider
  - spiders
     - __init.py__
  - items.py
  - middlewares.py
  - pipelines.py
  - settings.py
  - __init.py__
  
  
## Generate some spiders with templates from the command line

    scrapy genspider example example.com 
    scrapy genspider example2 example.com 
    scrapy genspider example3 example2.com 
    
  
## Writing a Simple Scraper

To create a crawler, you will add a new file inside the spiders directory at wikiSpider/wikiSpider/spiders/article.py. In your newly created **article.py** file, write the following:

```python
    import scrapy

    class ArticleSpider(scrapy.Spider):
        name='article'

        def start_requests(self):
            urls = [
                'http://en.wikipedia.org/wiki/Python_%28programming_language%29',
                'https://en.wikipedia.org/wiki/Functional_programming',
                'https://en.wikipedia.org/wiki/Monty_Python']
            return [scrapy.Request(url=url, callback=self.parse) for url in urls]

        def parse(self, response):
            url = response.url
            title = response.css('h1::text').extract_first()
            print('URL is: {}'.format(url))
            print('Title is: {}'.format(title))
```

## Run this article spider

You can run this article spider by navigating to the wikiSpider/wikiSpider directory and running from the command line:

    scrapy runspider article.py
        
## Run your project with at the project root directory

    scrapy crawl table -o table.csv  --logfile table.log
    

## Scrapy Shell

To do the crawler interactively, just run from the command line

    scrapy shell "http://en.wikipedia.org/wiki/Python_%28programming_language%29"

# Lab 

Use `scrapy` framework to implement the we studied with `BeautifulSoup`