不会写代码,如何抓取网页里的信息?

火箭君之前给大家提供过一个随机数据制造器(==Dummy Data生成器来了,你还为造数据而痛苦吗?==),能根据需要随机生成姓名、邮箱地址、句子…并且结果非常友善,复制到Excel就能用了。那么当我们在网站上看到一系列地址信息、商品信息甚至天气、新闻等真实信息,但因为数量庞大难以依靠手动复制黏贴来完整获取时,爬虫就能代替你完成所有工作。

——“如何向完全没有背景知识的人解释爬虫为何物?”

——“爬虫就是按一定规则替你浏览网页并复制黏贴东西下来的程序。”

是的,听起来很很高级,是不是要写代码啊?!网上一搜什么Python+Scrapy啊,功能强大到爆。但即使这样对于某些结构简单且只用于江湖救急的网站数据获取未免显得有些小题大做了,而且普通用户很可能折在装python+scrapy包这件事上

继续阅读“不会写代码,如何抓取网页里的信息?”

如何拯救你那被“奇怪日期”所绑架的excel文档?

不知道小伙伴们,有没有碰到过这样奇怪的事情:明明一个excel文档中的数据内容是以数字格式所保存的,但是重新打开后,却发现所有的数据都变成了奇怪的日期格式。而且即便更正后保存,再次打开却依然还是奇怪的日期。@# ¥%……&*(心中无数匹草泥马奔过!)

火箭君事后补充:一般发生在一些跨国企业的跨国格式保存的文档里面

来来来,让火箭君来帮助你拯救这个文档吧!

继续阅读“如何拯救你那被“奇怪日期”所绑架的excel文档?”