你的电脑上也能按关键字搜索到微信的精彩文章

微信文章不能在网页上被搜索到?

大家知道,微信的精彩文章一直是一种近乎封闭的资源,通过百度谷歌等搜索引擎的关键字都是搜索不到的。

其实,由于微信和搜狗有战略合作,微信的公众号和文章面对搜狗搜索竟然是开放的

细细一查,虽然是这不是新闻,但是火箭君也是才知道这个神奇的功能。

继续阅读“你的电脑上也能按关键字搜索到微信的精彩文章”

【长假书单】火箭君为您精选6本书(附带效率读书的回顾)

相信大家的 “国庆长假模式”已经开启,最好一直开启,不要关闭,每年欢庆365天。

火箭君觉得,大家在这几天里,无论是大鱼大肉好吃好喝,还是外出观看people mountain people sea,还不如好好利用这段时间,阅读一些平时没空看的好书,也算给自己一顿精神大餐。

对于有选择纠结症的小伙伴而言,选择看什么书一定很难,等到选完书单,长假已经结束了也不一定。

继续阅读“【长假书单】火箭君为您精选6本书(附带效率读书的回顾)”

不会写代码,如何抓取网页里的信息?

火箭君之前给大家提供过一个随机数据制造器(==Dummy Data生成器来了,你还为造数据而痛苦吗?==),能根据需要随机生成姓名、邮箱地址、句子…并且结果非常友善,复制到Excel就能用了。那么当我们在网站上看到一系列地址信息、商品信息甚至天气、新闻等真实信息,但因为数量庞大难以依靠手动复制黏贴来完整获取时,爬虫就能代替你完成所有工作。

——“如何向完全没有背景知识的人解释爬虫为何物?”

——“爬虫就是按一定规则替你浏览网页并复制黏贴东西下来的程序。”

是的,听起来很很高级,是不是要写代码啊?!网上一搜什么Python+Scrapy啊,功能强大到爆。但即使这样对于某些结构简单且只用于江湖救急的网站数据获取未免显得有些小题大做了,而且普通用户很可能折在装python+scrapy包这件事上

继续阅读“不会写代码,如何抓取网页里的信息?”

传说中的“暗网”到底是什么鬼?

DarkWeb和DeepWeb

首先要明确的Darkweb和DeepWeb的差别。网上有不少资料会告诉你:整个互联网上有大量的内容其实都是暗网信息,你平时能在互联网上看到的内容只占互联网能提供的内容的10%,可见暗网有多恐怖云云。

==其实并非如此,DeepWeb是广泛的无法被搜索引擎收录的互联网内容==

打个不恰当的比喻:天猫的所有肥皂店铺也算是无法被收入百度的;),下面这些天猫店铺下的所有子页面自然也不能被收入了!

继续阅读“传说中的“暗网”到底是什么鬼?”

你还记得15年前的网站啥样么?有人把他们都存下来了!

1966年,ARPANET;1982年,TCP/IP协议,Internet被定义为使用该协议连接起来的internet(注意是小写,Internet一直到2016年才被美联社启用小写,不再是专有名词);1985年,Symbolics.com成为第一个域名;1991年,WWW发布……互联网历史短短50年,已经对我们的生活产生了巨变。今天你可还记得,或者想看看以前的互联网长什么样?火箭君找到了一个组织,他们存下了过去的互联网……

Wayback Machine

继续阅读“你还记得15年前的网站啥样么?有人把他们都存下来了!”

大数据揭示人们最喜欢的6种剧情线走向

人类天生就善于发现和讲述故事。这些故事不仅能承载信息分享的使命,更是定义了我们的存在。正是这些特性,使得我们对故事如此迷恋。随着计算能力、语音处理能力和文本数字化的进程,我们已经有能力通过用大数据来分析某一种文字啦~今天火箭君要介绍的就是科学家用大数据研究出的6种,最吸引人的故事情节~

有趣的论文

佛蒙特大学(是一所美国的一流公立大学)的Andrew Reagan和他的团队使用文字的情绪分析技术为1300个故事中绘制了情绪线(emotional arcs),然后又用数据挖掘技术找到了其中最具有代表性的6种类型。

火箭君看到这篇论文的时候,觉得这个研究很有意思。因为他通过经验证据提出了一种揭示故事设计和故事对人类吸引力的方法!

继续阅读“大数据揭示人们最喜欢的6种剧情线走向”

被各种屏幕“俘获”的小伙伴们,你们需要一丝温暖

众所周知的事实是:如今各种屏幕无处不在,很多人的生活已经被屏幕“占领”。

每天上班有电脑屏幕,闲时有手机和平板屏幕,双休日家里还有各种屏幕。

对于那些长时间不得不看屏幕的小伙伴们(不管你是工作需要,还是强迫症),你们知道长时间看屏幕除了会得近视以外,还有其它什么弊端吗?

继续阅读“被各种屏幕“俘获”的小伙伴们,你们需要一丝温暖”