首页 > 代码库 > 老7临走前的笔记
老7临走前的笔记
此算法为python配合C++,改进和训练人工智能历经两个月的时间,收入增加效果明显,当然最主要的还是新算法起作用了。7月份9000多美元,8月份稍微增加一点,本月13000美元。这只是他网站收益的一部分,google adsense收入则更超出这个。另外需要分享的是, paypal对于年收入超过50000美元的,受外汇管制的营销,用户可以直接打上海办事处电话,客服会告诉你一些提高限额的渠道。
思路跟某些人说的全自动采集内容做站群,利用自己算法迷惑google思路比较接近,但具体细节摸索很多才能有点成效,主要靠大数据和机器深度学习完成。而且工作并没有很多人想象的那般轻松,采集会根据源做相应的调整。另外目前针对百度的效果还是有限,很多关键词搜索结果,百度中都不是匹配,不是百度不懂而是百度自私。Google则把最正确的用户需要的结果第一时间呈现给用户。
他也是个人单干,以前5人小团队因为长大后各自结婚生子而各奔东西,自己也是利用github上开源的人工智能加深度学习组件了机器群,其实也就是几台强悍点的服务器。按照AlphaGo的思路,让其在网络里自行学习和运算,在某些(你懂得)搜索引擎和能获得优势的网站上给出最佳途径和对比方式。例如站群这一面,自行列出单价和浏览访问量,再自行搜集数据建立相应的网站(这个用python实现)。这样的好处就是能不会被Google或者其他反作弊系统识别,可以长期稳定来做。
关于有些人对全自动采集站可读性的质疑,他试图清晰的解释下其中一种最见效的方式。“比如说一段时期,“风油精”这个关键词很火——全智能大数据分析的,你也可以建立这样的一个大数据分析链,也可以使用某些机构的成果,github上有,我就是直接提取结果的。之后利用这个关键词,迅速的创建与之相关的域名和网站(这一部是程序员都能实现,我用的是python,大赞python),整个流程就是以接近病毒式扫描和创建关键词,以web形式呈现,引来的流量是非常可怕的,所以我有很多小vps负责负载。这就是google的一方面,还有某些细节属于个人核心技术了,等你到了那一步其实自然就能懂了。”
“再透露一点,关键问题点到为止哈。多想想自然就明白,机会是给有准备的人。比如“风油精”这个关键词,不管是围绕这个词的网站也好,论坛版块也好,单页文章也罢,所有信息数据均智能采集网络(有开源的程序判断文字的流畅性和可读性的,这点不用担心),接下来把采集来的数据如何排列起来才是亮点,就模拟那种回帖方式的啊,紧凑的那种,明白了吗?用户以为还真是人在回帖呢,比如这个风油精的使用感受之类的,PV会爆,我的小vps承受不了怎么办呢?github pages啊,无限的啊,小vps+github不用担心任何问题。关于检测那个语句的流畅和可读性,我的程序里里是去掉了的,太影响速度和效率了,以为要去其他平台逐句逐句的对比。索性去掉,反正收集的信息基本都是流畅完整的,到时候按照一定的方式(算法)打乱拼接就可以了,力争做到网络重复率极低便可。”
关于adsense垃圾采集站被K账号的问题,老7则分享说:“首先,不说站垃圾不垃圾,任何公司包括google都不会去定义一个网站是否垃圾或者歧视采集来的文章,更不会认为低人一等。例如很多人复制shadowsocks的文章,*现在百度屏蔽了shadowsocks 关键词*,这个文章的某些技术和知识就是适合自己本人,你就让其在你的小站上存在,天经地义。搜索引擎注重的是转换率和价值(复制的文章也是有价值的,高低而已,原创的价值最高)。你被k是否有某些不正当的流量,不要去购买那些所谓的几万十几万的ip流量,我可以告诉你,还不如不买(触犯某些人的利润,抱歉)原理和原因就不解释了,码字麻烦,而且得罪人。其次就是莫名其妙的点击和跳转后停留的时间等等等等因数。我的g帐号很多,近两年都没有K过。可以借鉴,最后祝网赚愉快。”
同时也声明,本人绝非炫耀显摆,我能力和精力有限,不想把自己推入漫天口水的是非之地,如果你怀着质疑和寻找任何瑕疵的目的点开这个帖子,再看下去就显得很不明智了。首先,我是个非常普通的小程序员,能使用QT+C++ 和python+pycharm平台。跟CSDN里面那些真正的高手比起来,他们几乎完全可以碾压我。若想致力与网络上生存,学一门语言真的非常必要,现在python几乎能完成任何你能想象的网络工作,从那么多语言走过来,力顶python,它简单,语法清晰,应该在语言难度系数里最低了,功能却超乎寻常的强大,可以说能静心下来看书的人一定能学会。也可以说这个时代的我们能接触到python是种莫大的荣幸,有朋友私信问我哪本书适合?在此统一回答,买第3版本,越厚越好,因为详细和例子多。还有就是算法,我很惊讶有些朋友说网赚还需要算法?我不敢正面回答,保持缄默,不想意见相左,因为大家都知道在论坛里很容易把这样的冲突上升到问候对方先人的惨烈程度。其实算法在我们身边无处不在,就连最基本的一个最新帖子的发出,都使用到了算法来排序。能解决任何问题的方法都是算法,搜索剪枝,A*寻径,博弈树和遗传算法等等最基本的算法就是构**
算法的定义就是解决问题的方式和途径,方式和途径不一样,效率和效果也不一样,程序=代码+算法。算法才是程序的灵魂。github上集合了太多人类的智慧和思路,有时间可以多看看。做网赚,再怎么说也要会门语言,讲究效率的时代,哪能拼人力。祝网赚愉快
老7临走前的笔记