Coding 的痕迹

一位互联网奔跑者的网上日记

0%

方程组的几何解释

矩阵的发明是为了用一种简洁的方式表达线性方程组。对于一个方程组,如 $$\left{\begin{align*}2x - y = 0\ -x + 2y = 3\end{align*}\right.$$ ,可以写成矩阵和未知量相乘($$ A \mathbf x = \mathbf b $$)的形式:

[2112][xy]=[03]\begin{bmatrix}2 & -1 \\ -1 & 2 \end{bmatrix} \begin{bmatrix}x \\ y \end{bmatrix} = \begin{bmatrix}0 \\ 3 \end{bmatrix}

矩阵分为行(row)和列(column)。

对于这个矩阵,可以画出它的行图像(Row picture):

方程组在坐标系的表示

阅读全文 »

背景

想将校园网上的文章、通知和附件缓存到本地,通过数据库的全文检索查找其中内容,并决定使用 PostgreSQL 来实现。略检索了一下有关资料,主要有 pg_jiebazhparser 两个中文分词库。这里我们就是用 zhparser

阅读全文 »

前期爬取了网上的一些文章,并存储到 PostgreSQL 中。但是当时用以提取发布日期的方法不太好,提取成功率很低。幸好观察存储的 URL,似乎其中包含了发布日期。格式大概是:

1
2
3
'/2020/0909/random_numbers/page.htm'
# 或
'/_t147/2020/0909/random_numbers/page.htm'

便想到在 PostgreSQL 中调用 Python 实现日期提取。

阅读全文 »

导数的概念

例: 若 limh0f(x0+h)f(x0h)h=0\lim_{h\rightarrow 0} \frac{f(x_0 + h) - f(x_0 - h)}{h} = 0,能否推出 f(x0)f'(x_0)

考虑函数 f(x)=xf(x) = |x|, 当 x=x0=0x = x_0 = 0 时,f(x)=0f'(x) = 0

但该点左右极限不相等,x|x|00 处不可导,所以不能推出。(p20 24:00)

命题 f(x)f(x)x0x_0 处可导 \Leftrightarrow f(x0)=f+(x0)f_-'(x_0) = f_+'(x_0)

阅读全文 »

数列

定义域为 NN 的函数 xn=f(n),nN+x_n = f(n), n \in N_+,写作 x1,x2,,xn,x_1, x_2,\dots,x_n,\dots{xn}\{x_n\}。一般讨论数列的单调性有界性

例:试证以下数列单调增加且有界:(p4 数列的极限1)

  1. xn=2+2++2x_n = \sqrt{2+\sqrt{2+\dots+\sqrt2}}nn 重根号)
  2. xn=a+a++ax_n = \sqrt{a + \sqrt{a+\dots+\sqrt a}}nn 重根号,a>0a > 0

数列 xn{x_n} 中的无穷项,它们下标依次为 n1<n2<<nk<n_1 < n_2 < \dots < n_k < \dots,则称数列 xn1,xn2,,xnk,x_{n_1},x_{n_2},\dots,x_{n_k},\dots{xn}\{x_n\}子列,记为 {xnk}\{x_{n_k}\}

阅读全文 »

本篇主要是高中知识的复习与补充。大部分内容来源于乐经良教授主讲《高等数学》的“实数集”一课,此外也收录了笔者在后续课程中发现自身的缺失之处,以及常用的高中知识点。

集合

具有某种属性的事物的全体称为集合。元素用小写字母(如 aa)表示,集合用大写字母(如 AA)表示。 aaAA 的元素: aAa \in Aaa 不是 AA 的元素: aAa \notin A

集合具有确定性、互异性、无序性。

阅读全文 »

xx, yy 为两个变量 (xD)(x \in D). 对任意的 xDx \in D,总存在唯一确定的 yyxx 对应,称 yyxx 的函数,记作 y=f(x)y = f(x).

函数在 DDx0x_0 对应的 f(x0)f(x_0) 称为函数在 x0x_0 的值,有时记为 fx0f|_{x_0}

常见的函数

符号函数

y=sgn x={1,x<00,x=01,x>0y = sgn\ x = \left\{ \begin{aligned} -1, & x < 0 \\ 0, & x = 0 \\ -1, & x > 0 \end{aligned} \right.

阅读全文 »

背景

最近在开发“上应小风筝”的电费统计功能后端接口。前端突然反馈说数据有问题:前端页面中计算得到的平均值和电费排名中的消费量不一致。(如图,图上 0.05 即为均值,但此图为事后截,无太大问题)

电费统计页(事后截图)

去查看后端返回的数据,发现最后 8 小时电费情况始终为 0 元,而与实际金额不符。因此怀疑是时区问题的锅。

阅读全文 »

数据库备份是实际运维中必须进行的操作,然而有时因为没空或者懒,便忽视了这项工作,有时甚至造成损失。

背景

今天早上对本博客的 nodejsnpm 进行升级时,apt 提示部分包可以使用 apt autoremove 命令删除。为了减少系统体积,便执行了。因为注意到执行前系统内存占用在 600M 左右,执行后内存占用在 240M 左右,便感觉到不对劲。于是首先便想到了同一台服务器上的数据库,执行:

1
2
root@Aliyun:~# systemctl status postgres
Unit postgres.service could not be found.

想着出事了,博客上运行的 PostgreSQL 不翼而飞。由于用户量不大,开始不慌不忙地进行恢复工作。

阅读全文 »

Rust 使用 tesseract 识别验证码

近期需要将验证码识别功能集成到一个 Rust 项目中,验证码图片大概这样:

验证码图片示例

观察

首先观察图片,发现前景文字和背景图片颜色深度差别较大,可以对图片进行二值化处理。使用 Photoshop 可以看到,转为灰度图像后,在 0 ~ 255 内,前景和背景大约以 130 为界。使用 “天若OCR” 截图、识别了若干张图片,在较大截图区域的情况下,识别率可以达到 100%,说明这个验证码不复杂。由于在线 API 有数量等限制,最终将目光锁定在了 tesseract 上。

阅读全文 »