Jinliang Blog

生活有度 人生添寿

seq2seq模型与注意力机制

seq2seq模型与注意力机制解析

1. seq2seq模型 seq2seq模型,从表面意思了解,就是序列到序列的模型,即输入为序列,输出也为序列。 我们常见的机器翻译与图像描述就是显著的代表,我们首先简单了解一下这两个任务。 机器翻译 机器翻译任务中,我们将网络分为编码网络与解码网络。 编码网络是一个RNN结构,可以使GRU,或者是LSTM,它接收输入序列,然后输出一个向量代表输入序...

深度学习-词嵌入

深度学习-词嵌入解析

1. 什么是词嵌入 在序列模型一章中,我们使用one-hot向量来表示词,这种表示方法的缺点就是它把每个词孤立起来,使得算法对相关词的泛化性不强。 为此,我们需要换一种表达方式,不使用one-hot表示,而是用特征化的表示来表示每一个词,我们学习词典中每个词的特征或者数值。 类似于上图这种方式,我们可以找到300个不同的特征,每个词汇在这300个特征是都使用不同的数字表示,这个每个...

深度学习-序列模型

深度学习-序列模型解析

1. 数学建模 我们通过一个例子学习序列模型,这个例子就是命名实体识别,需要能够自动识别语句中人名位置的序列模型。 Harry Potter and Herminoe Granger invented a new spell. 例如上面这个输入,我们的输出应该为: 1 1 0 1 1 0 0 0 0 其中使用$x^{<1>},x^{<2>},x^{<3...

目标检测算法浅析

目标检测算法浅析

1. 目标定位 我们首先研究一个简单的定位分类问题,通常只有一个较大的对象位于图片中间位置,我们对他进行定位和识别。 首先描述我们的分类问题,分类结果为行人、汽车、摩托车、背景。背景意味着不含前三类。 然后加上定位,我们可以输出红色方框的中心点、高度、宽度。 根据上述分类与定位逻辑,采用监督学习的方法,标签定义为: 如上图所示,p_c表示是否有行人、汽车、摩托车,当p_c=0时...

卷积神经网络

卷积神经网络解析

1. 边缘检测 当我们获取到一张图片时,我们想要知道这张图片中有什么物体,为了实现这个目的,我们做的第一件事就是边缘检测,可能需要检测垂直边缘,也可能同时需要水平边缘,但是边缘检测是怎样做的?原理是怎样的呢? 如上图所示,是一张灰度图像,是$6\times 6\times 1$的矩阵,因为是灰度的,所以没有RGB通道,不是$6\times 6\times 3$的。 为了检测上述图像...

仔仔大人的实习准备

小猪猪莫要猖狂

在小练习之前的了解过程中,请勿深入某个技术细节,切记!切记!!切记!!! 语言 java 官方文档地址(不需要看) 开发环境 Android Studio 略 基础组件 官方文档中针对组件有的描述很详细,有的大概介绍主要内容,此处尽量选取中文版、大概介绍的官方文档。 Activity 官方文档(中文,概述、仅有一页,如果感觉太多,仅看一级标题内容) 一级标题如图所示: ...

强化学习-基于近似的在策略预测

强化学习-基于近似的在策略预测

在本次学习中,我们主要进行预测,也就是根据策略估计值函数,关于控制(提升策略)将放在后一章。 我们的题目是基于近似的预测,什么是近似呢,就是我们不在把状态值函数表示成一个表格,而是一个向量$\textbf w$,$\hat v(s,w) \approx v_\pi(s)$。$\hat v(s,w)$是估计值,它是状态$s$和参数$w$的函数。如果这个函数是一个线性函数,那么w就是状态特征向...

深度学习策略与经验

深度学习策略与经验

在这章中,我们会学习到一些策略、分析深度学习问题的方法、部署深度学习产品的经验等等。 1. 正交化 为什么标题叫做正交化,正交意味着互成90度,可以理解为互不影响,能够单独调节一个装置,改变某个属性,在此同时对其他属性没有影响。 当我们想要调节我们的深度学习系统,想让他变得更好时,往往有很多方向,但是如果方向错误的话,就会浪费大量的时间,因此,我们要学会的第一件事,就是如何找到系统的问...

n步自举

n步自举介绍

在之前的学习中,我们学习了MC方法和TD方法,其中TD方法严格说属于TD(0)方法。 如果我们从采样回报与估计回报的角度来看,MC方法与TD(0)方法分别处于两个极端。MC方法采样全部的回报,不使用自身值函数的预测;TD(0)方法只进行单步采样,然后使用值函数预测之后的回报。最好的方法就是这两种的结合,TD(0)属于单步自举,自举最好发生在一段时间之后,$n$-步的方法就是我们在多步之后实...

聚类算法(原型、密度、层次聚类)

聚类算法(原型、密度、层次聚类)介绍

1. 聚类任务 无监督学习:训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。 无监督学习中,研究最多、应用最广的是聚类 常见的无监督任务有:聚类、密度估计、异常分析 聚类试图将数据集中的样本划分为若干个通常不想交的子集,每个子集称为一个”簇” 注意:聚类任务仅能自动形成簇结构,簇所对应的概念语义需由使用者来...