自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

null的专栏

Keep your eyes open and your feet moving forward. You'll find what you need.

  • 博客(186)
  • 资源 (4)
  • 论坛 (1)
  • 收藏
  • 关注

原创 《Python机器学习算法》勘误

本书在出版的过程中已经经过详细的检查,但是大小问题依旧存在,感谢各位细心的读者为本书指出的错误。 第34页的错误在Python2.7.9版本上不会报错。 第1版第一次印刷勘误 页码 原文 修改 XVI (目录)12.3.2 Mean shift 12.3.2 DBSCAN 26 (程序清单1-11:第11行)h r

2017-09-15 21:43:56 4138 16

原创 《Python机器学习算法》的写作历程

最近有两个多月的时间没来更新博客,是一直在忙着一件事——将博客中的一些文章整理成书。一开始写博客,给自己的文章建了一个响亮的标题《简单易学的机器学习算法》,但是发现写着写着,每一个算法也变得没那么简单易学,因此想对这些零散的知识点做一次全面的整理。最初是一年前有了这个念头,一直没有去实践,自己给自己找了很多的借口,今年8月份,这个念头又一次那么强烈的袭上心头,没有太多思考,说干就干。。。决定了,但是

2016-09-28 14:30:59 17962 23

原创 新的10大数据挖掘、机器学习算法

一、原来的10大算法2006年,IEEE的数据挖掘会议选出了10大算法:[见点击打开链接]C4.5k-MeansSupport Vector Machines(SVM)AprioriExpectation Maximization(EM)PageRankAdaBoostk-Nearest Neighbors(kNN)Naive BayesClassification and Regre

2015-01-18 14:07:17 6912

原创 C++中的explicit关键字

1. explicit关键字explicit的中文含义是显示的,在C++中主要用于防止隐式转换的发生。那么什么是隐式转换,以如下的代码为例#include <iostream>using namespace std;class Demo { public: Demo() {} Demo(int a) { _value1 = a; } int get_value() {

2021-01-30 10:31:35 35

原创 文本分类fastText算法

1. 概述在深度学习遍地开花的今天,浅层的网络结构甚至是传统的机器学习算法被关注得越来越少,但是在实际的工作中,这一类算法依然得到广泛的应用,或者直接作为解决方案,或者作为该问题的baseline,fastText就是这样的一个文本分类工具。fastText是2016年由facebook开源的用于文本分类的工具,fastText背后使用的是一个浅层的神经网络,在保证准确率的前提下,fastText算法的最大特点是快。2. 算法原理2.1. fastText的模型结构fastText是如何保证速度的呢

2020-12-05 17:35:31 100

原创 推荐系统中的常用算法——序列深度匹配SDM

1. 概述2. 算法原理参考文献Lv F , Jin T , Yu C , et al. SDM: Sequential Deep Matching Model for Online Large-scale Recommender System[J]. 2019.[深度模型] 阿里大规模深度召回序列模型SDMSDM:用户长短期兴趣召回模型...

2020-10-16 17:56:10 468

原创 推荐系统中的常用算法——基于Session的推荐

1. 概述

2020-10-16 13:15:56 320

原创 推荐系统中的常用算法——行为序列Transformer(BST)

1. 概述2. 算法原理参考文献Chen Q , Zhao H , Li W , et al. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba[J]. 2019.阿里推荐算法(BST): 将Transformer用于淘宝电商推荐

2020-10-13 00:25:10 404

原创 推荐系统中的常用算法——基于Graph Embedding的GES和EGES

1. 概述GES和EGES是阿里在2018年提出的两个Graph Embedding算法,其中GES全称为Graph Embedding with Side Information,EGES全称为Enhanced Graph Embedding with Side Information。2. 算法原理参考文献Wang J, Huang P, Zhao H, et al. Billion-scale commodity embedding for e-commerce recommendat

2020-09-30 01:14:47 803

原创 深度学习算法原理——LSTM

1. 概述在循环神经网络RNN一文中提及到了循环神经网络RNN存在长距离依赖的问题,长短期记忆(Long Short-Term Memory,LSTM)网络便是为了解决RNN中存在的梯度爆炸的问题而提出。在LSTM网络中,主要依靠引入“门”机制来控制信息的传播。2. 算法原理2.1. LSTM的网络结构LSTM的网络结构如下所示(图片来自参考文献):与循环神经网络RNN相比,LSTM的网络结构要复杂的多。在LSTM网络中,通过引入三个门来控制信息的传递,这三个门分别为遗忘门(forget ga

2020-09-20 23:54:33 182

原创 深度学习算法原理——循环神经网络RNN

1. 概述循环神经网络(Recurrent Neural Networks, RNN)主要用于时序数据,最常见的时序数据如文章,视频等,ttt时刻的数据与t−1t-1t−1时刻的数据存在内在的联系。RNN模型能够对这样的时序数据建模。2. 算法原理RNN模型的基本结构如下所示(图片来自参考文献):如上图所示,循环神经网络通过使用自带反馈的神经元,能够处理任意长度的时序数据,对此结构按照时间展开的形式如下所示(图片来自参考文献):2.1. RNN的结构上图中给出了RNN的内部结构,RNN根据

2020-09-17 19:52:15 130

原创 推荐系统中的常用算法——DeepWalk算法

参考文献Perozzi B, Alrfou R, Skiena S. DeepWalk: online learning of social representations[J]. 2014:701-710.DeepWalk源码《DeepWalk: Online Learning of Social Representations》笔记C实现的DeepWalk...

2020-09-16 01:25:28 343

原创 机器学习算法实现解析——libFM之libFM的训练过程概述

本节主要介绍的是libFM源码分析的第四部分——libFM的训练。FM模型的训练是FM模型的核心的部分。4.1、libFM中训练过程的实现在FM模型的训练过程中,libFM源码中共提供了四种训练的方法,分别为:Stochastic Gradient Descent(SGD),Adaptive SGD(ASGD),Alternating Least Squares(ALS)和Markov Chain

2020-08-07 00:25:09 6181

原创 深度学习算法原理——RCNN

相比较于图像分类来说,目标检测(Object Detection)不仅需要标记出图像中的物体(通常使用边框标记),同时需要指出该物体是什么。一般比较直观的想法包括以下的三个步骤:得到候选区域;提取候选区域的特征;对该候选区域分类;RCNN(Region with CNN features),又称为基于区域的卷积神经网络,也是基于上述的思路的一种目标检测的方法,基本的思路如下图所示:...

2019-10-02 15:19:05 1067

原创 深度学习算法原理——Attention-Based BiLSTM

论文地址:Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification文章中提到使用双向的LSTM(Bidirectional LSTM)加上Attention的机制处理文本分类的相关问题,以解决CNN模型不适合学习长距离的语义信息的问题。1. 网络结构在Attention...

2019-07-01 23:31:55 5913 1

原创 深度学习在NLP中的应用——TextCNN

论文地址:Convolutional Neural Networks for Sentence Classification这篇文章是首次将CNN模型应用在文本分类中,在我的工作中,也是经常需要使用到TextCNN这样的文本分类方法。1. TextCNN的网络结构TextCNN的模型结构中主要包含如下的几个部分:Embedding层:将词映射成对应的向量。以上图为例,7个词被影射到对应...

2019-06-29 16:04:21 1179

原创 深度学习算法原理——Deep Structured Semantic Models(DSSM)

参考文献https://blog.csdn.net/shine19930820/article/details/78810984

2019-06-22 15:17:42 1961 1

原创 深度学习算法原理——经典CNN结构之AlexNet

AlexNet卷积神经网络是具有历史意义的网络结构,其在2012年的ImageNet图像分类竞赛中,top-5错误率比上一年的冠军下降了十个百分点,而且远远超过当年的第二名。1、AlexNet的网络结构 参考文献

2019-06-22 13:33:19 921

原创 深度学习算法原理——经典CNN结构之LeNet-5

参考文献

2019-06-15 09:21:05 631

原创 python技巧——将list中的每个int元素转换成str

在Python中,有时需要将list以字符串的形式输出,此时可以使用如下的形式:",".join(list_sample)其中,,表示的是分隔符如需要将a_list = ["h","e","l","l","o"]转换成字符输出,可以使用如下的形式转换:a_list = ["h","e","l","l&qu

2018-07-05 20:19:32 57494 4

原创 情感分析——深入snownlp原理和实践

一、snownlp简介snownlp是什么? SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使...

2018-06-26 11:23:16 47868 18

原创 TensorFlow实践——Multilayer Perceptron

本文是在Softmax Regression的基础上增加了一个隐含层,实现了Multilayer Perceptron的一个模型,Multilayer Perceptron是深度学习模型的基础,对于Softmax Regression的TensorFlow实现,可以参见博文“TensorFlow实践——Softmax Regression”。对于Multilayer Perceptron的基本原理...

2018-04-26 22:53:25 825

原创 TensorFlow实践——Softmax Regression

Softmax Regression是Logistic回归在多分类上的推广,对于Logistic回归以及Softmax Regression的详细介绍可以参见:简单易学的机器学习算法——Logistic回归利用Theano理解深度学习——Logistic Regression深度学习算法原理——Softmax Regression下面的代码是利用TensorFlow基本API实现的...

2018-04-18 10:38:29 865

原创 挑战数据结构和算法面试题——二叉搜索树的后序遍历

题目来源“数据结构与算法面试题80道”。在此给出我的解法,如你有更好的解法,欢迎留言。分析:根据二叉查找树的定义,二叉查找树或者是一棵空二叉树,或者是具有一下特性的二叉树:若它的左子树不为空,则左子树上的所有结点的值均小于根节点的值;若它的右子树不为空,则右子树上的所有结点的值均小于根节点的值;它的左右子树又分别是二叉查找树。结合二叉树的后序遍历,则初始序列...

2018-04-09 15:23:31 897 1

原创 挑战数据结构和算法面试题——连续最长数字串

题目来源“数据结构与算法面试题80道”。在此给出我的解法,如你有更好的解法,欢迎留言。问题分析:字符串的处理,判断每一位是不是数字,用到了函数isdigit方法:int continumax(char *outputstr, char * inputstr){ if (NULL == inputstr) return 0; char *p = inpu...

2018-04-07 12:08:45 836

原创 挑战数据结构与算法面试题——统计上排数在下排出现的次数

题目来源“数据结构与算法面试题80道”。在此给出我的解法,如你有更好的解法,欢迎留言。分析:本题应该是一个确定的问题,即上排的是个数是题目中给定的十个数。其基本的解题过程为:[10,0,0,0,0,0,0,0,0,0][9,0,0,0,0,0,0,0,0,1][8,1,0,0,0,0,0,0,1,0][7,2,1,0,0,0,0,1,0,0][6,2,1,0,...

2018-03-19 20:14:59 455

原创 挑战数据结构和算法面试题——最大间隔

题目来自伯乐在线,欢迎有不同答案的同学来一起讨论。分析:本题首先需要理解清楚最大间隔的最小:最初的间隔为:[1,1,4,1],此时最大间隔为4删除2后的间隔为:[2,4,1],此时最大间隔为4删除3后的间隔为:[1,5,1],此时最大间隔为5删除7后的间隔为:[1,1,5],此时最大间隔为5在删除元素后的间隔为:[4,5,5],最小值为:4方法:int...

2018-03-15 20:45:26 659

原创 挑战数据结构和算法——栈的push、pop序列

题目来源“数据结构与算法面试题80道”。在此给出我的解法,如你有更好的解法,欢迎留言。问题分析:本题考查栈的基本操作,栈是一种“先进后出”的数据结构。判断一个序列是否是栈的pop序列是一种常见的问题,可以通过模拟push和pop的过程,push和pop总是成对出现的,如:方法:#define push 1#define pop -1bool judge_pus...

2018-03-14 14:20:41 4407

原创 挑战数据结构和算法——整数的二进制表示中1的个数

题目来源“数据结构与算法面试题80道”。在此给出我的解法,如你有更好的解法,欢迎留言。问题分析:本题涉及到二进制的处理,在本题使用到&amp;操作和&gt;&gt;操作。方法:int get_num(int n){ int num = 0; if (n &lt; 0){ num += 1; n = n * (-1); ...

2018-03-14 14:18:54 475

原创 挑战数据结构和算法——跳台阶问题

题目来源“数据结构与算法面试题80道”。在此给出我的解法,如你有更好的解法,欢迎留言。问题分析:假设f(n)f(n)f\left ( n \right )为跳台阶的总跳法,当n=1n=1n=1时,f(n)=1f(n)=1f\left ( n \right )=1;当n=2n=2n=2时,f(n)=2f(n)=2f\left ( n \right )=2;当n=3n=3n=3时,如果...

2018-03-14 14:15:49 542

原创 挑战数据结构和算法面试题——左旋转字符串

题目来源“数据结构与算法面试题80道”。在此给出我的解法,如你有更好的解法,欢迎留言。问题分析:本题是常见的旋转字符串的问题,解决的方法是两步旋转的方法:方法:void do_reverse(char *p_start, char *p_end){ if (NULL == p_start || NULL == p_end || p_start &gt; p_...

2018-03-14 14:11:36 338

原创 机器学习中的基本问题——log损失与交叉熵的等价性

1、log损失log损失的基本形式为:log(1+exp(−m))log(1+exp(−m))log\left ( 1+exp\left ( -m \right ) \right )其中,m=y⋅y^m=y⋅y^m=y\cdot \hat{y},y∈{−1,1}y∈{−1,1}y\in\left \{ -1,1 \right \}。 对上述的公式改写: ⇒1m∑i=1...

2018-03-09 20:20:43 10400 1

原创 挑战数据结构和算法面试题——最大差值

题目来自伯乐在线,欢迎有不同答案的同学来一起讨论。分析:基本方法是遍历数组,找到当前值前面所有数组元素的最小值。方法:int get_max_distance(int *a, const int n) { int max_distance = 0; // 纪录最大距离 if (n == 0) return max_distance; int min = ...

2018-02-28 23:32:10 642 2

原创 推荐系统中的常用算法——Wide & Deep

这篇文章是阅读《Wide &amp; Deep Learning for Recommender Systems》后的总结,该文章中提出结合Wide模型和Deep模型的组合方法,对于提升推荐系统(Recommendation System)的性能有很重要的作用。1、背景本文提出Wide &amp; Deep模型,旨在使得训练得到的模型能够同时获得记忆(memorization)...

2017-10-07 20:10:16 31198 5

原创 论文阅读——利用Binary Hash Codes的深度图像检索

这篇文章是阅读《Deep Learning of Binary Hash Codes for Fast Image Retrieval》后的总结,该文章提出了一种利用CNN处理基于内容的图像检索的方法。文章的重点图像的binary hash code的生成方法两阶段的检索方法——coarse-to-fine search strategy1、基于内容的图像检索...

2017-08-29 14:03:25 2887

原创 推荐系统——(论文阅读笔记)YouTube推荐中的深层神经网络

这篇文章是阅读YouTube的《Deep Neural Networks for YouTube Recommendations》后的一点总结,这篇文章值得详细阅读,因此将其中的核心点整理出来。文章的重点1、总结推荐系统的架构2、如何利用深度模型做召回3、如何利用深度模型做Ranking1、推荐系统的架构在本文中,推荐系统的架构与其他的推荐架构极为类似,都是由两...

2017-08-25 13:17:07 5497 3

原创 机器学习算法实现解析——liblbfgs之L-BFGS算法

在博文“优化算法——拟牛顿法之L-BFGS算法”中,已经对L-BFGS的算法原理做了详细的介绍,本文主要就开源代码liblbfgs重新回顾L-BFGS的算法原理以及具体的实现过程,在L-BFGS算法中包含了处理L1正则的OWL-QN算法,对于OWL-QN算法的详细原理,可以参见博文“优化算法——OWL-QN”。1、liblbfgs简介liblbfgs是L-BFGS算法的C语言实现,用于求解非线性优

2017-08-20 17:27:34 5378 3

原创 算法类面试题解析——美团2016校招:棋子翻转

题目来自伯乐在线,欢迎有不同答案的同学来一起讨论。分析:本题主要是二维数组的操作,对指定的位置上的数字进行翻转,其具体过程如下所示:其基本的过程如下:遍历数组二,如上图中的红色位置: 找到其周围的四个位置,注意数组的上下界验证没有越界的条件下,对其进行修改方法:void do_reverse(int **a, int k, int i, int ...

2017-08-07 13:30:52 2388

原创 挑战数据结构与算法面试题——80题全解析(三)

题目来源“数据结构与算法面试题80道”。这是第三部分,包含其中的第11题到第15题。 在此给出我的解法,如你有更好的解法,欢迎留言。问题分析:涉及的知识点是二叉树的遍历,遍历的方法主要有:先序遍历中序遍历后序遍历层次遍历在本题中,使用先序遍历的方法。方法:void m_length(BSTreeNode *root, int *length, i...

2017-08-04 11:26:01 1884

原创 挑战数据结构与算法面试题——80题全解析(一)

题目来源“数据结构与算法面试题80道”。这是第一部分,包含其中的第1题到第5题。 在此给出我的解法,如你有更好的解法,欢迎留言。问题分析:二叉查找树是一种二叉树的结构,其中,根节点的值大于左子树的值,小于右子树的值。而二叉查找树的中序遍历即为排序的结果。对于根节点,前驱指针指向左子树中最大的节点,同理,后驱指针指向右子树中最小的节点,如下图所示:树是一种递归的结果,因...

2017-07-22 22:23:11 16158 9

在线顺序极限学习机OS-ELM的python实现

与博文(http://blog.csdn.net/google19890102/article/details/45273309)配套的实验

2015-04-25

线性回归实验数据

与我的博客内容同步http://blog.csdn.net/google19890102

2014-05-22

logistic回归测试数据

与我的博客配套,具体参照我的博客文章简单易学的机器学习算法——Logistic回归

2014-05-12

达内java学习笔记-总最全

java学学习必备 面向对象主要针对面向过程。 面向过程的基本单元是函数。 什么是对象:EVERYTHING IS OBJECT(万物皆对象) 所有的事物都有两个方面: 有什么(属性):用来描述对象。 能够做什么(方法):告诉外界对象有那些功能。 后者以前者为基础。 大的对象的属性也可以是一个对象。 为什么要使用面向对象: 首先,面向对象符合人类看待事物的一般规律。 对象的方法的实现细节是屏蔽的,只有对象方法的实现者了解细节。 方法的定义非常重要。方法有参数,也可能有返回值。 注意区分:对象(本身)、对象的实现者、对象的调用者。 分析对象主要从方法开始。 我们通过类来看待对象,类是对象的抽象。 其次,采用面向对象方法可以使系统各部分各司其职、各尽所能。

2011-01-24

zhiyong_will的留言板

发表于 2020-01-02 最后回复 2020-04-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除