AIJVS

发表于2026-07-03|自然语言处理

引言对计算机来说，”你好”和”hello”只是两个字节序列，它不懂”你好”背后的含义。 NLP（自然语言处理）要做的事就是让计算机理解人类语言。但文本数据有个麻烦——它不像图片那样天然有像素坐标结构。本文带你走完 NLP 的标准流程：原始文本 → 清洗 → 分词 → 向量化 → 词嵌入，这是后续一切 NLP 任务的基础。前置知识机器学习入门：概念与分类全解 Python 编程基础（一）：从零搭建你的AI开发环境一、NLP 的核心挑战1.1 语言 vs 计算机语言计算机 “苹果很好吃” 字节序列 “我今天买了苹果手机” 同一个词，不同意思 “I am running” ~ “The running water” 同一个词，不同词性 “苹果很好吃” ~ “我吃了苹果” “苹果”出现了位置变了三个核心问题：分词 — 一句话拆成什么单位？歧义 — 同一个词在不同上下文什么意思？表示 — 怎么把词变成计算机能算的数字向量？ 1.2 NLP 的典型任务1234567分词/词性标注 ─── 基础任务（管道上游） ↓命名实体识...

计算机视觉入门：图像处理基础

发表于2026-07-03|计算机视觉

引言计算机视觉（CV）是 AI 最成熟的落地领域之一：手机人脸解锁自动驾驶识别行人和车辆医学影像辅助诊断电商以图搜图短视频滤镜和特效所有这些技术的底层都是图像处理。这篇文章从像素开始，带你走完”传统图像处理 → 深度学习特征提取 → CV 任务全景”的完整路径。前置知识数学基础（一）：线性代数——让机器学会看向量神经网络架构详解：CNN 卷积神经网络看完 CNN 那篇再来，效果好一倍。一、图像在计算机中的表示1.1 一张图片 = 一个三维数组123灰度图 (Grayscale): [H×W] — 每个像素 0-255 的亮度值彩色图 (RGB): [H×W×3] — 三个通道：红/绿/蓝RGBA 图: [H×W×4] — 多一个 Alpha（透明度）像素值范围通常是 0-255（8 位），深度学习会归一化到 0-1 或 -1~1。 123456789101112131415import cv2import matplotlib.pyplot as...

神经网络架构详解：RNN 与 LSTM

发表于2026-07-03|深度学习

引言CNN 处理的是图片——有空间结构。那文本、语音、股价、视频呢？这些是序列数据，长度不固定，前后有依赖关系。 “I love this movie” 和 “I don’t love this movie”——同一个词 “love”，因为前面有个 “don’t”，意思完全反了。 RNN（循环神经网络）就是为序列数据设计的——它能记住前面看到的信息来影响当前的判断。但 RNN 有个致命缺陷：长期依赖问题——看了 100 个词之后，第 1 个词的信息基本被遗忘了。这就是 LSTM（长短期记忆网络）要解决的问题。前置知识深度学习入门指南：从零开始理解神经网络 PyTorch 实战（二）：构建第一个全连接网络理解神经网络的基本概念就够了。一、为什么需要 RNN？传统网络的问题1234567传统神经网络（全连接 / CNN）:输入 → [网络] → 输出每个输入独立处理，没有"记忆"能力。"I am from China, I speak ______"→ 需要记住前面说了 "China" 才能预测 &q...

神经网络架构详解：CNN 卷积神经网络

发表于2026-07-03|深度学习

引言上一篇文章我们用全连接网络实现了手写数字识别——但你知道吗？如果换成人脸识别、自动驾驶场景，全连接网络基本不 work。原因很简单：全连接把 28×28 的图片展平成 784 个独立的像素，完全丢掉了空间结构信息。一张猫的图片，把像素随机打乱，全连接网络认不出来了。 CNN（卷积神经网络）就是来解决这个问题的——它用卷积核在图片上滑动，保留空间结构，捕捉局部特征。这也是为什么 CNN 统治了计算机视觉领域近十年。前置知识 PyTorch 实战（二）：构建第一个全连接网络 AI数学基础（一）：线性代数——让机器学会看向量需要已经会用 PyTorch 搭网络、跑训练循环。一、CNN 的核心思想为什么全连接不行？全连接层的参数量 = 输入维度 × 输出维度。对于一张 256×256 的彩色图片： 12输入: 256 × 256 × 3 = 196,608全连接层（128个神经元）: 196,608 × 128 ≈ 2500 万参数 2500 万个参数就一层！三层下去直接上亿，根本训不动。 CNN 的三大优势全连接 CNN 每个像素独立局...

PyTorch 实战（二）：构建第一个全连接网络

发表于2026-07-03|深度学习

引言上篇文章我们学了张量操作和自动微分——相当于拿到了砖头和水泥。这篇我们来盖第一栋房子：用 PyTorch 的 nn.Module 构建全连接神经网络，完成手写数字识别。写完这篇文章的代码，你就走通了深度学习的完整流程：数据加载 → 模型定义 → 训练 → 评估。前置知识 PyTorch 实战（一）：张量操作与自动微分机器学习入门：概念与分类全解尤其是 PyTorch（一）中的 requires_grad、backward()、梯度更新——这些是本文的基础。一、项目结构总览12345678910111213┌──────────────┐ ┌──────────────┐ ┌──────────────┐│ DataLoader │────▶│ Model │────▶│ Trainer ││ 数据加载器 │ │ 模型定义 │ │ 训练循环 │├──────────────┤ ├──────────────┤ ├──────────────┤│ - MNIST 数...

PyTorch 实战（一）：张量操作与自动微分

发表于2026-07-03|深度学习

引言上一篇文章用了 KNN 做分类，KNN 并不需要梯度。但从神经网络开始，自动求导（Autograd）就成了最核心的基础设施。 PyTorch 之所以成为深度学习领域的第一框架（没有之一），两个原因：动态计算图 — 边运行边构建，调试方便，灵活度高自动求导 — 你只需要定义前向传播，反向传播自动算好本文从零开始，带你掌握 PyTorch 的两大核心：张量操作和自动微分。前置知识 Python 编程基础（二）：变量、数据类型和基本运算 Python 编程基础（三）：NumPy——AI工程师的第一件武器 AI数学基础（一）：线性代数——让机器学会看向量会用 NumPy 就够了，PyTorch 的 Tensor API 和 NumPy 几乎一模一样。一、安装与配置1pip install torch torchvision torchaudio 验证安装： 12345import torchprint(f"PyTorch 版本: {torch.__version__}")print(f"CUDA 可用...

机器学习入门：概念与分类全解

发表于2026-07-03|基础教程

引言你学了 Python，补了数学，知道神经网络长什么样——但机器学习到底是什么？简单说：机器学习就是让计算机从数据中自动学习规律，然后用学到的规律做预测或决策。传统编程是你告诉计算机每一步怎么做，机器学习是你给计算机大量例子，让它自己找出规则。比如识别猫：传统编程：写规则「有尖耳朵、有胡须、会喵喵叫 → 是猫」——太死板，换只品种就不认了机器学习：给 10 万张猫和狗的图片，让模型自己发现「猫的特征分布」——新图片来了也能猜看完这篇，你会掌握机器学习的三大分类、核心概念，并且能手写第一个分类模型。前置知识 Python 编程基础（一）：从零搭建你的AI开发环境 AI数学基础（二）：概率论——教机器做不确定的决策只要会 Python 基础语法就能跟上。不需要高等数学。一、机器学习的三大分类所有的机器学习问题都可以归入三类： 1. 监督学习（Supervised Learning）有标签数据，模型学习「输入 → 输出」的映射关系。 123# 训练数据：既有特征（花的尺寸），又有标签（品种）# 特征: [花萼长度, 花萼宽度, 花瓣长度, 花瓣宽度]# 标...

AI数学基础（一）：线性代数——让机器学会"看"向量

发表于2026-06-17|基础教程

AI数学基础（一）：线性代数——让机器学会”看”向量300年前那个改变世界的夜晚1691年的一个秋夜，法国小镇上，一个17岁的少年在昏暗的烛光下写日记。他的名字叫亚伯拉罕·棣莫弗（Abraham de Moivre）。这个少年可能不会想到，他那天晚上在日记里随手画的一个坐标系——用两条垂直的直线来表示平面上的点的位置——会在300多年后，成为让人工智能”看见”这个世界的基础工具。你想想看，当你用手机拍照时，照片在电脑眼里是什么？就是一堆数字。一张1920×1080的图片，在AI眼里就是一个1920×1080的数字矩阵。每个数字代表一个像素的亮度或颜色值。AI要”看懂”这张图，就得对这些数字进行运算——而这些运算，全都是线性代数。所以今天，咱们就来聊聊：线性代数到底是什么？为什么AI离不开它？一、标量、向量、矩阵：从地图坐标到Excel表格1. 标量：就是一个数字最简单的开始。标量（scalar）就是一个单独的数字。 15、3.14、-2、100 比如：”今天气温23度”——这个”23”就是标量。它只有一个数值，没有方向。 2. 向量：有方向的数组向量（vector...

AI数学基础（三）：微积分——理解"变化"的语言

发表于2026-06-17|基础教程

AI数学基础（三）：微积分——理解”变化”的语言17世纪，伦敦瘟疫中的天才1665年，伦敦爆发了一场可怕的瘟疫（后来被称为”伦敦大瘟疫”）。剑桥大学被迫关闭，一个23岁的年轻人收拾行李，回到了家乡林肯郡的伍尔索普庄园。他的名字叫艾萨克·牛顿（Isaac Newton）。接下来的两年里，在这个安静的乡村庄园中，牛顿做出了改变人类历史的发现：微积分（Calculus）。他当时在思考一个看似简单的问题： “物体的瞬时速度到底是什么？” 你想想看，如果你开车，速度表显示”60 km/h”——这个”瞬时速度”是怎么来的？你总不能”瞬间”跑60公里吧？牛顿的回答：用极限的思想，把”变化”放大到无穷小，就能捕捉到那一刻的变化率。 300多年后，这个”捕捉变化”的思想，成了人工智能最核心的工具。因为深度学习的本质，就是”找最优”——而找最优，需要理解变化。一、为什么学AI要懂微积分？深度学习的终极目标：找最优训练一个AI模型（比如识别猫狗的神经网络），本质上是在做一件事：调整参数，让”错误”最小。这个过程叫做优化（Optimization）。而优化的核心工...

AI数学基础（二）：概率论——教机器做"不确定的决策"

发表于2026-06-17|基础教程

AI数学基础（二）：概率论——教机器做”不确定的决策”1654年，赌桌上的争吵改变世界1654年的某一天，法国巴黎的一家咖啡馆里，两个贵族为一件事吵得面红耳赤。他们叫帕斯卡（Blaise Pascal）和费马（Pierre de Fermat）——对，就是中学数学课本里那个”费马大定理”的费马。他们在争论一个看似简单的问题：两个赌徒玩掷硬币游戏，约定先赢4次的人拿走全部赌注。如果游戏进行到3:2时（A赢了3次，B赢了2次）被迫中止，赌注应该怎么分才公平？这个问题看起来简单，却难住了当时所有数学家。帕斯卡和费马通过通信，发明了概率论的基础——用数字来描述”不确定性”。 300多年后，这个”赌桌上的争吵”成了人工智能的核心工具。因为现实世界充满不确定性，而AI必须学会在不确定中做决策。一、为什么AI离不开概率？现实世界不是非黑即白你想想看：医疗诊断：AI看CT片子，说”这个结节有87%的概率是恶性的”——不是”是”或”不是”，而是概率。语音识别：你说”帮我打开空调”，AI听到的是一堆声波，它要判断”最可能”是什么词。自动驾驶：前面有个模糊的影子，是塑料袋还是...