算法的乐趣之贪婪法

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 算法 浏览 :

贪婪法(Greedy Algorithm),又称贪心算法,是寻找最优解问题的常用方法,这种方法模式一般将求解过程分成若干个步骤,但每个步骤都应用贪心原则,选取当前状态下最好的或最优的选择(局部最有利的选择),并以此希望最后堆叠出的结果也是最好或最优的解。因为不进行回溯处理,贪婪法只在很少的情况下可以得到真正的最优解,比如最短路径问题、图的最小生成树问题。在大多数情况下,由于选择策略的“短视”,贪婪法会错过真正的最优解,而得不到问题的真正答案。但是贪婪法简单、高效,省去了为找最优解可能需要的穷举操作,可以得到与最优解比较接近的近似最优解,通常作为其他算法的辅助算法来使用。

TensorFlow-Serving部署分类模型

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 机器学习 浏览 :

使用 Ubuntu 18.04 部署 TensorFlow 分类模型。TensorFlow Serving with Docker

高级集成学习技巧

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 数据科学 浏览 :
  • Averaging (or blending)
  • Weighted averaging
  • Conditional averaging
  • Bagging
  • Boosting
  • Stacking
  • StackNet

高级调参技巧

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 数据科学 浏览 :

以下是 Coursera 上的How to Win a Data Science Competition: Learn from Top Kagglers课程笔记。

高级特征工程II

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 数据科学 浏览 :

该部分专注于此高级特征工程:计算由另一个分组的一个特征的各种统计数据和从给定点的邻域分析得到的特征。

高级特征工程I

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 数据科学 浏览 :

以下是 Coursera 上的How to Win a Data Science Competition: Learn from Top Kagglers课程笔记。

顶级Kagglers的心得和技巧

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 数据科学 浏览 :

本篇可以算是顶级 Kaggler 大佬们,经过上百场比赛总结的心得和技巧。对准备开始参加数据挖掘竞赛的新人们极其有用,可以为你节省不少时间。

科学计算环境配置教程

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 数据科学 浏览 :

TF-GPU 科学计算环境安装教程,安装时注意版本,流程一致,版本可更新。

《机器学习》线性模型公式推导与算法实现

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 机器学习 浏览 :

参考西瓜书《机器学习》线性回归

给定训练集$D={(\boldsymbol x_1, y_1), (\boldsymbol x_2, y_2), ..., (\boldsymbol x_i, y_i), ( \boldsymbol x_n, y_n)}$,其中$\boldsymbol {x_i} = (x_{i1};x_{i2}; ...; x_{im})$,$y_i\in \mathbb{R}$.线性回归(linear regression)试图学得一个线性模型以尽可能准确地预测实值输出标记

大数加法

发布时间 : 2020-01-22
发布 : 2020-01-22 分类 : 算法 浏览 :

大数加法代码实现