最后结果txt无法输出

jike_0258251 Python 单线程爬虫 最后由 jike_8594665 于07月23日回复

  • 2 回答
  • 246 浏览
最后结果txt无法输出

txt里面没有内容

  • kingname 07月14日 回答 #1楼
  • 你应该把代码截图。详细描述你遇到的问题。

    否则你这个问题无头无尾,怎么给你解答。

  • 0 评论
  • jike_8594665 07月23日 回答 #2楼
  • #geteveryclass用来抓取每个课程块的信息 def geteveryclass(self,source): everyclass = re.findall('<li id="[0-9]{4}"(.*?)</li>',source,re.S) print everyclass return everyclass #getinfo用来从每个课程块中提取出我们需要的信息 def getinfo(self,eachclass): info = {} info['title'] = re.search('alt="(.*?)">',eachclass,re.S).group(1) info['content'] = re.search('<p style="height: 0px; opacity: 0; display: none;">(.*?)</p>',eachclass,re.S).group(1) print info['content'] timeandlevel = re.findall('<em>(.*?)</em>',eachclass,re.S) info['classtime'] = timeandlevel[0] info['classlevel'] = timeandlevel[1] info['learnnum'] = re.search('"learn-number">(.*?)</em>',eachclass,re.S).group(1) return info

  • 0 评论