Gripex-lee's Blog


  • 主页

  • 关于Lee

  • 标签

  • 目录

kaggle泰坦尼克号生存预测-随机森林

发表于 2018-09-25
字数统计: 2,557 | 阅读时长 ≈ 11

titanic
泰坦尼克号(RMS Titanic)的沉没是历史上最被人熟知的一次沉船事件。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并导致了更好的船舶安全规定。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管幸存下沉有一些运气因素,但有些人比其他人更容易生存,比如女人,孩子和上流社会。
这个实验将进行乘客的存活分析,来预测哪些乘客幸免于难。

阅读全文 »

重庆二手房房价影响因素

发表于 2018-08-29
字数统计: 3,603 | 阅读时长 ≈ 15

house
当城市规模发展到一定程度之后,城市建设将会由外延式拓展逐渐让位于内涵式的更新、改造和保护。这意味着受城市土地资源的限制,新建房数量会逐步减少,而存量房的保有量将会越来越大,此时房地产市场的交易重心必然会从新房转移到二手房上来。本次试验通过对链家重庆二手房公开数据的统计分析,研究影响重庆二手房房价的影响,为二手房定价提供理论依据。

阅读全文 »

Hadoop 伪分布式下的 wordcount 示例

发表于 2018-08-01
字数统计: 461 | 阅读时长 ≈ 2

hadoop
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。数据处理中如果R,python处理不了的大数据可以通过Hadoop实现。

阅读全文 »

Python爬取人民网新闻评论并制作词云

发表于 2018-07-17
字数统计: 461 | 阅读时长 ≈ 2

comments

目标网址

紧紧抓住大有可为的历史机遇期

阅读全文 »

Python对天堂图片网的简单图片爬取

发表于 2018-07-12
字数统计: 634 | 阅读时长 ≈ 3

天堂网爬虫
爬虫是python最主要的应用领域之一,在了解了网站的结构之后,通过python就可以轻松实现数据的抓取,本次通过requests以及re库实现图片的抓取。

目标网址

天堂图片网

阅读全文 »

Github托管文件

发表于 2018-07-04
字数统计: 282 | 阅读时长 ≈ 1

Github

GitHub是开源软件项目的托管平台,因为只支持git作为唯一的版本库格式进行托管,故名GitHub。
2018年6月4日,微软宣布,通过75亿美元的股票交易收购代码托管平台GitHub。

阅读全文 »

Lee

6 日志
13 标签
© 2018 Lee
本站访客数: