Home

机器学习导图系列(1):数据处理

机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多功夫。我又将导图整理成了知识卡片,方便大家查看。由于机器学习的知识网络很大,导致完整的导图过大,文章中的图片可能经过压缩,如需完整图片可查看github项目machine-learning-mindmap-cn下载高清原图。本系列还在持续创作中,你的点赞、留言、star都会成为我持续创作的动力。 Daniel Formoso: https://github.com/dformo...

Read more

驳 《驳 《驳 《停止学习框架》》》

今天看了三篇文章。 《停止学习框架》 《驳 《停止学习框架》》 《驳 《驳 《停止学习框架》》》 说实话,我凑热闹的心态超过辩论(抬杠)的心态。本文只是借此机会表达一些观点,至于切不切提不重要,能引发你的一些思考才重要。 上面三篇文章或多或少都能给读者提供一些思考,希望大家结合自己的能力、所处的环境找到适合自己的方向,不要完全跟着作者的思路走。 技术是工具 当你掌握了某种框架,你就有能力用它来解决问题,这个情景和大猩猩用石头砸开核桃没什么区别。我写的《如何成为10倍速的程序员》中有提到,要善用工具。你的大脑的运算力是有限的,你的精力、你的生命都是有限的。你一生可以做的事情是有限的。懂得寻找捷径让人类成为了智慧生物。 框架,无疑是程序员解决问题的工具。至于要把工具掌握到什么程度,取...

Read more

比起看新闻、读公众号文章,我为什么选择读书?

1 让普通人丧失独立思考、深度思考的能力,似乎是全球统治阶层“愚乐”(tittytainment)计划的一部分,来消耗“边缘人”的精力与不满情绪。 抖音就是一个例子。毫无营养的新闻、自媒体文章也算。 阅读,是人们获取信息的重要途经,是人们提升认知的有效手段。现在的文字内容越来越“个性化”,同时将人“驯化”,就像当初人类将野兽驯化成牲畜。 我之前写过一篇技术文章《AI时代:推荐引擎正在塑造人类》,其中提到的观点大致如此:智能推荐算法会推荐符合读者标签的内容,而读者在不知不觉中会被塑造成契合推荐算法的人。 因为,人工智能是有偏见的。 为什么这么说呢?我尽量用通俗的话稍微解释下,机器学习是有准确率的,机器学习不能代表100%的人,这也就意味着机器学习会让大多数人来代表全部的人。这看...

Read more

在阳台放把椅子

在阳台放把椅子 在寂静的凌晨 放下所有的事情 一个人 看一看窗外寥寥的灯火 这灯火 真好 当你关掉客厅的灯 让自己置身于黑暗 你会发现室外的分明 看看远处的海 或者看看漆黑的角落 甚至看看诡谲的树影 你会发现 这黑暗 真好 当你身处黑暗 哪里都有光 当你身处低谷 怎么走都是对的方向 事情似乎变得异常容易 这简单 真好 想想曾经承受的打击 似乎要铺天盖地的毁灭你 挺过来 就是烧不死的凤凰 领悟了生活 觉醒了思想 强大了人格 别人觉得走投无路 你能看到一万种可能 这越走越宽的路 真好 无所畏惧的极致 终究是归于平淡的 在黑暗里的人 从不...

Read more

捅马蜂窝:从来不是为了正义!

对于《马蜂窝数据造假》事件,趁着还没有盖棺定论,我先发表自己的看法,以示我的预测之准确。 1 梓泉及乎睿数据团队抓取马蜂窝评论数据得出结论—马蜂窝2100万评论内容1800万是造假得来。 梓泉所列数据说服力极强,可以肯定的说,他所推论的结果很正确。马蜂窝数据造假确凿无疑。 但在马蜂窝数据造假事件中,不存在利益冲突,只有马蜂窝一方利益受损,而梓泉(乎睿数据)甚至是收益方—新增粉丝超过10万。 在这种情形下,马蜂窝一定会不遗余力的寻找证据来控告梓泉(乎睿数据)方。至于结果如何,我几乎可以肯定的说,梓泉败诉的可能性极大。至于会不会出现事件反转,我不敢预测。 法官的判决会考虑舆论,但不会完全被舆论左右。 2 数据可以说是互联网上最重要的资源,随着大数据的发展这种资源的竞争愈演愈...

Read more

心比天高,命比纸薄。

心比天高,命比纸薄。 你的心气再高,死了也就死了。你为之拼搏的、争取的更是无从谈起。活着,就是最大的赢家。 活着,需要智慧。活着本身,也是智慧。 你在知名巨头企业做着精英,租住着含有甲醛的出租屋。没错,是出租屋的错,可是你死了。 你是人人夸口称赞的美女,打着居心叵测的车。没错,是顺风车的错,可是你死了。 人的生命有多脆弱? 你的体温超过38度5就属于高烧,1天不喝水你就会脱水,5分钟不呼吸你的大脑会大面积缺氧,失血15%你就会出现休克窒息。温度、湿度、氧气等多种因素哪怕有一点点变量,你都可能失去生命。 有人说,”生当做人杰”。 有人说,”人生自古谁无死,留取丹心照汗青”。 你追求的社会地位,你追求的出人头地,你追求的金钱、荣耀、财富、美女都需要你活着,你死了,这些有什...

Read more

汉字简化也救不了文盲

Illiteracy is a major problem in some developing countries. 声明:文章观点是我个人观点,当然可以反驳。文中的思维、逻辑才是重点,是本文的根本价值。你看后有所收获,是本文的最终目的。 1 汉字简化,始于太平天国,是为了提升识字率。 以上,就是汉字简化的因果、目的。 2 我当然不是为了掀起繁简汉字之争,如果刻意追求繁体所谓的高逼格,自然是没有必要的。 简体字又叫简单字,听到名字就可以知道这是为了那些脑回路简单、思维模式简单的人刻意设计的。真正意义的汉字简化运动,应该从1950年算起,也就是新中国成立的第二年。可以说,我们的祖国为了让你的脑袋里装些”干货”,煞费苦心。 3 这里我们先说一个前置条件,当然,是指理论...

Read more

那些10w+的公众号都在写什么?

出于好奇,那些10w+的公众号都写了些什么,于是我写了几个脚本爬取了各行业Top的公众号文章,进行了关键词统计。 抓取数据、分析用到了3中语言:Node.js,Java,Python。废话不多说,直接上代码。 1(NODEJS) puppeteer模拟登陆,抓取微信公众号链接: /** * load wechat article urls on newrank.cn **/ const puppeteer = require('puppeteer'); //emulate iphone const userAgent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Geck...

Read more