机器学习43条军规

Oct 29, 2017

机器学习43条军规:解密谷歌机器学习工程最佳实践Rule #1: Don’t be afraid to launch a product without machine learning.规则1:不要害怕上线没有机器学习的产品。中心思想一句话概括:If you think that machine learning will give you a 100% boost, then a heuristic will get you 50% of the way there.Rule #2: ...

Read more »

标签: ml


数据库分库分表

Aug 6, 2017

数据库Sharding的基本思想和切分策略一、基本思想Sharding的基本思想就要把一个数据库切分成多个部分放到不同的数据库server上,从而缓解单一数据库的性能问题。不太严格的讲,对于海量数据的数据库,如果是因为表多而数据多,这时候适合使用垂直切分,即把关系紧密(比如同一模块)的表切分出来放在一个server上。如果表并不多,但每张表的数据非常多,这时候适合水平切分,即把表的数据按某种规则(比如按ID散列)切分到多个数据库(server)上。当然,现实中更多是这两种情况混杂在一起,这...

Read more »

标签: 数据库


常见机器学习方法总结

May 27, 2017

这里总结了常见的几个机器学习算法:朴素贝叶斯、决策树、逻辑回归、线性回归、KNN、SVM、Boosting、聚类、pLSA、LDA、GDBT、Regularization、异常检测、EM算法、Apriori、FP-Growth,从优点、缺点、需要注意的地方等几个方面进行了分析和讨论。原文链接:http://www.chinakdd.com/article-oyU85v018dQL0Iu.html朴素贝叶斯 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例)...

Read more »

标签: ML


shuniz =======>>> 博客.