Markdown进阶

一. 前言

John Gruber在2004年创造了Markdown语言 在语法上有很大一部分是跟[亚伦- 斯沃茨](https://baike.baidu.com/item/亚伦- 斯沃茨/4027108?fromModule=lemma_inlink)( Aaron Swartz) 共同合作的. 这个语言的目的是希望大家使用" 易于阅读 易于撰写的纯文字格式 并选择性的转换成有效的XHTML( 或是HTML) " . 其中最重要的设计是可读性 也就是说这个语言应该要能直接在字面上的被阅读 而不用被一些格式化指令标记( 像是RTF与HTML) . 因此 它是现行电子邮件标记格式的惯例 虽然它也借鉴了很多早期的标记语言 如: Setext Texile reStructuredText.

阅读全文 »

VBA-字符串处理-语言层级bug

一. 前言

最近碰到一个比较有趣的vba编写的错误, 处理该问题时, 突然想起很早之前的一个vba语言层的bug.

相关内容见本人在这个帖子上的描述, @liucqa你的问题暂时解决了_VBA字符串/字符编码/字符集谜题-Excel VBA程序开发-ExcelHome技术论坛 -.

二. 问题

该问题为语言层级的bug所导致.

该问题在百度上能够检索到的相关页面最早见于可能是在2010版本的office上出现.

问题很简单, 当使用instr, split函数处理字符串时, 部分的字符串上会出现异常错误.

阅读全文 »

地址拆分-Excel公式执行循环操作

一. 前言

问题来源于

=LEFT(P2,MIN(FIND({"省","市","区"}, P2&"省市区")))

被问及一个问题, find()中的大括号是什么意思.

这个, 很简单, 大括号是excel在表格公式实现数组的符号, 具体见Excel有趣函数系列-lookup | Lian (kyouichirou.github.io).

关键不在于此, 而是突然对于excel公式如何处理地址切割问题起了兴趣.

检索了一下必应, 并未发现相对可行的演示案例, 大部分的示例excel公式不是过于简陋, 就是各种函数层层叠叠, 令人望而生畏. 有没有简单易于理解的切割方式呢, 于是动手尝试一下.

阅读全文 »

PCA&SVD-摘要

一. 前言

1.1 涉及矩阵基础

单位矩阵:(一般使用I, E来表示)I=[100010001]:ATA=I,A:(AT)T=A(A1A2..An)T=AnT..A2TA1T:A=[a11a22a33a44]:AT=A:AB=BA=IA=B1B=A1(AB)1=B1A1,A,B,.AA1=AT\text{单位矩阵:(一般使用I, E来表示)}\\ I= \begin{bmatrix} 1 & 0 & \cdots & 0\\ 0 & 1 & \cdots & 0\\ \vdots&\vdots & \ddots & \vdots\\ 0 & 0 & \cdots & 1 \end{bmatrix}\\\\ 正交矩阵: A^TA = I, 则称A为正交矩阵\\\\ 矩阵的转置:(A^T)^T = A\\ (A_1A_2..A_n)^T = A_n^T..A_2^TA_1^T\\\\ 对角矩阵:\\ A = \begin{bmatrix} a_{11} & & & \\ & a_{22} & & \\ & & a_{33}&\\ & & &a_{44} \end{bmatrix}\\ 对角矩阵的转置等于自身: A^T = A\\\\ 逆矩阵: AB = BA = I\\ A = B ^{-1}\\ B = A ^{-1}\\ (AB) ^{-1} = B^{-1}A^{-1}, A, B同阶, 可逆\\ 单位矩阵的逆矩阵是其本身.\\ 正交矩阵A的逆矩阵A^{-1} = A^T

阅读全文 »

Longley数据集-多重共线性问题与岭回归

一. 前言

一元线性回归详解 | Lian (kyouichirou.github.io)中提及了多重共线性(Multicollinearity)的问题, 由于是一元线性回归, 并未对该问题做深入的探讨.

下面以Longley数据集为例, 分别以spss, python对相关问题展开讨论.

数据源见: https://www.itl.nist.gov/div898/strd/lls/data/LINKS/DATA/Longley.dat

阅读全文 »

Pandas周边-ydata-profiling(数据概览)

一. 前言

原名Pandas-profiling, 现在已经更换新的名称, ydata-profiling

文档见: https://ydata-profiling.ydata.ai/docs/master/index.html

pandas-profiling (文档还是老名称) primary goal is to provide a one-line Exploratory Data Analysis (EDA) experience in a consistent and fast solution. Like pandas df.describe() function, that is so handy, pandas-profiling delivers an extended analysis of a DataFrame while alllowing the data analysis to be exported in different formats such as html and json.

该库的目标在于提供类似于pandas的描述性统计的一站式数据概览(EDA)支持.

阅读全文 »