locked
如何抓取谷歌,百度里面特定的搜索结果! RRS feed

  • Question

  • 如题,在自己的网页里面写一个搜索引擎,输入搜索条件搜索后,在自己的页面里面显示抓取谷歌和百度里面的特定的搜索结果,例如搜索结果是  百度里面的(第一,第五,第八条)+谷歌里面的(第一条,第四条)的搜索结果组合!希望大家踊跃发言!表达自己的观点和想法,大家互相探讨和学习!希望能讲详细一些!供大家共同研究和探讨!谢谢!
    • Moved by Sheng Jiang 蒋晟 Friday, May 8, 2009 4:17 AM 特定网站问题 ([Loc]From:ASP.NET 与 AJAX)
    • Moved by Sheng Jiang 蒋晟 Friday, May 13, 2011 4:57 PM 非微软服务开发问题 (From:一般性问题讨论区)
    Friday, May 8, 2009 1:23 AM

Answers


  •  string html = @"<h3>3月历史气候概况</h3>
                    <dl>
                        <dt>月累计降水量(mm)</dt>
                        <dd><strong>8.3</strong></dd>
                        <dt>月平均温度(℃)</dt>
                        <dd><strong>5.8</strong></dd>
                        <dt>月极端最高温度(℃)</dt>
                        <dd><strong>26.4</strong></dd>
                    </dl>";
            string pstr = "<dt>月累计降水量.*?<dd><strong>(?<yljjsl>[^<]*)</strong></dd>";
            Match m = Regex.Match(html, pstr, RegexOptions.Singleline);
            if (m.Success)
            {
                string yljjsl = m.Groups["yljjsl"].Value;
                Response.Write(yljjsl);
            }

    • Marked as answer by 时代天子 Saturday, May 9, 2009 3:26 AM
    Friday, May 8, 2009 3:00 AM

All replies

  • 取到的页面用正则得到每条记录,再组合


    http://feiyun0112.cnblogs.com/
    Friday, May 8, 2009 1:45 AM
  • http://www.googleapi.cn/

    google提供了完备的接口
    工作突然有点忙 嘿嘿
    Friday, May 8, 2009 1:52 AM
  • 取到的页面用正则得到每条记录,再组合


    http://feiyun0112.cnblogs.com/

    感谢你的回答,我在网上也看到有人这样说的,但是可以取到页面内容,(用正则得到记录)这是什么意思?以前没有接触过,希望这位能讲详细一点!非常感谢!
    Friday, May 8, 2009 2:00 AM
  • 你好,把数据取回来,然后再过滤,一般是用正则表达式,然后再比对,去除重复的内容,最后入库。
    jon.valett@gmail.com
    Friday, May 8, 2009 2:06 AM
  • 你好,把数据取回来,然后再过滤,一般是用正则表达式,然后再比对,去除重复的内容,最后入库。
    jon.valett@gmail.com

    您好,很感谢您抽时间来回复我的问题,因为我也是刚入门不久,没有做个这样的例子,所有大脑里面也没有什么思路,使用正则式是如何过滤的?能给出一点具体的代码么?我可以参考和学习!感谢
    Friday, May 8, 2009 2:21 AM

  •  string html = @"<h3>3月历史气候概况</h3>
                    <dl>
                        <dt>月累计降水量(mm)</dt>
                        <dd><strong>8.3</strong></dd>
                        <dt>月平均温度(℃)</dt>
                        <dd><strong>5.8</strong></dd>
                        <dt>月极端最高温度(℃)</dt>
                        <dd><strong>26.4</strong></dd>
                    </dl>";
            string pstr = "<dt>月累计降水量.*?<dd><strong>(?<yljjsl>[^<]*)</strong></dd>";
            Match m = Regex.Match(html, pstr, RegexOptions.Singleline);
            if (m.Success)
            {
                string yljjsl = m.Groups["yljjsl"].Value;
                Response.Write(yljjsl);
            }

    • Marked as answer by 时代天子 Saturday, May 9, 2009 3:26 AM
    Friday, May 8, 2009 3:00 AM
  • 你好,把数据取回来,然后再过滤,一般是用正则表达式,然后再比对,去除重复的内容,最后入库。
    jon.valett@gmail.com

    您好,很感谢您抽时间来回复我的问题,因为我也是刚入门不久,没有做个这样的例子,所有大脑里面也没有什么思路,使用正则式是如何过滤的?能给出一点具体的代码么?我可以参考和学习!感谢

    楼主,你好,本想发个例子给你的,sainaxingxing已经回答了,请参考他的,谢谢!
    jon.valett@gmail.com
    Friday, May 8, 2009 4:18 AM
  • 你好,把数据取回来,然后再过滤,一般是用正则表达式,然后再比对,去除重复的内容,最后入库。
    jon.valett@gmail.com

    您好,很感谢您抽时间来回复我的问题,因为我也是刚入门不久,没有做个这样的例子,所有大脑里面也没有什么思路,使用正则式是如何过滤的?能给出一点具体的代码么?我可以参考和学习!感谢

    楼主,你好,本想发个例子给你的,sainaxingxing已经回答了,请参考他的,谢谢!
    jon.valett@gmail.com

    我想多看看例子,以便扩充和理解啊!如果不麻烦的话,请发给我!谢谢
    Friday, May 8, 2009 5:12 AM