千帆过尽,筑梦未来

作者:wanthings | 2017-07-10 | 阅读 : 494
20年过去了,香港由一个可谓黑色孤岛迅速发展成远东轻工业制造中心和国际金融中心、贸易中心、信息中心、令世人为之侧目。另一方面,国家的“十三五”规划和“一带一路”倡议亦巩固和提升了香港的金融、贸易、航运三大中心地位。

1941年12月8日,日寇入侵香港;12月25日,港英宣布投降 ,香港进入历史上最黑暗的“3年零8个月”。沦陷记忆是黑色的,那些老一辈香港人回忆起来,他们都会说还能再惨过那三年零8个月吗。日本兵的肆意滥杀,强取豪夺,大饥荒中人吃人的惨状,香港在日占期间 ,人口由占前的200万人迅速减少至60万人。

1997年6月30日,也就是20年前,是一个值得纪念的伟大的日子,举国山下都在盼望零点时分香港回归的交接仪式。我猜那时候的全国人民心中都充斥着一份情怀 ,爱国的情怀,对国家感到自豪与感恩的情怀。

那么,20年过去了,香港由一个可谓黑色孤岛迅速发展成远东轻工业制造中心和国际金融中心、贸易中心、信息中心、令世人为之侧目。另一方面,国家的“十三五”规划和“一带一路”倡议亦巩固和提升了香港的金融、贸易、航运三大中心地位。由此可见,近些年来 ,香港的发展是巨大的,那么我想谈的发展绝对离不开科技发明,离不开互联网。可以这么说,互联网是科技时代的最重大业绩,以至于我们现在的生活根本离不开互联网。小时候,没有电脑,没有智能机,我们的日子还是可以过得像花儿般美好,而现在,离开了WiFi,上不了网,看不了最热的新闻,还怎么玩?这就是发展。

随着发展的快速,互联网似乎又成就了大数据,如果单单从量来看的话,大数据从互联网流行哪一刻起,就存在着。现在和过去的区别之一,就是大数据已经不仅存在于特定的某个区域,而是产生于我们每天的日常生活之中,Facebook、Twitter等社交媒体上的文本数据是最好的例子。而且,尽管我们无法得到全部数据,但大部分数据可以通过公开的API(应用程序编程接口)相对容易地进行采集。在B2C企业中,使用文本挖掘(text mining)和情感分析等技术,就可以分析消费者对于自家产品的评价。或者通过开发爬虫,通过服务器对大量数据进行高速抓取的数据采集模式,就能得到的一手数据。无论金融、房地产、建筑、法律还是教育。只要互联网公开,就没有爬虫办不到。而且现在大数据的抓取和储存已经大大降低了难度,只需要极小的时间成本就可以办到,当然,服务器的损耗是相对较大的。无论是刚刚创业的企业,还是中小企业或者大型企业,任何企业都可以对大数据进行充分利用。

 

聊到这里,不得不说一下蜘了这个爬虫,为什么取名蜘了,因为蜘蛛是一种爬行动物,我们是希望它像蜘蛛一样,布下天罗地网,爬取到任何你想要的数据。目前的蜘了还在成长的阶段,它已经成功地抓取到了一些商圈的数据,如果你想要知道在大众点评或者其他娱乐APP上,成都某些地区的饮食、酒店、景点的地理位置、包括大众对他们的评价、点赞数。这些都完全不是问题。当然,蜘了掌握的不只是商圈的数据,就像我说的,只要你想要的,互联网公开的,何不找蜘了帮你解决。

最后,到如今,依然可以隔着屏幕感受大家对香港回归20周年的欢腾,作为一名中国人,最骄傲的是当面对别的外来恶势力时,我们中国人的不屈不挠不放弃的爬虫精神。

了解网信天成更多观点

推荐阅读