Jupyter Notebook + Python + Bash 备忘#

Jpynb备忘#

改变Notebook里面Markdown文字颜色#

例如想要这样的效果：foo bar foo

foo <font color='red'> bar </font> foo

其实就是一个HTML的attribute。

Matplotlib中`'\theta'`变为`heta`的问题#

这是因为\t在字符串中会被转义为Tab，所以要在字符串前加上一个r。

更新markdown中的图像#

在路径后面加上一个?1，数字可以改变。

来源

Kill 宋体！#

Win下jpynb里面的宋体看的我生不如死。这个可以用Jupyter theme来解决。要注意的是它不会更改默认主题中的字体，一定要给指定一个主题。

Python备忘#

## Numpy中的矩阵合并 - 列合并/扩展：np.column_stack() - 行合并/扩展：np.row_stack()

## Pandas

DataFrame里面选出几列：df[['a', 'b']]

从pdf中提取表格#

先安装tabula-py： pip install tablua-py

导入，使用：

import tabula
tabula.read_pdf('xxx.pdf', options='--pages 4')

读取固定宽度表格#

pd.read_fwf('catalog/Kovtyukh/Kovtyukh04/table1.dat',
                           colspecs=[(0,10), (11, 15), (16,19), (20,24), (25,29), (30,34), (35,40), (41,46),
                                     (47,52), (53,68)],
                           names=['Star', 'Teff', 'N', 'e_Teff', 'logg', 'Vt', '[Fe/H]', 'VMAG',
                                  'B-V', 'Rem'])

在已有的DataFeame中添加列#

df1 = df1.assign(e=p.Series(np.random.randn(sLength)).values)

有关SettingwithCopy警告#

这里

Matplotlib#

防止重叠或者出边界#

plt.tight_layout()

画密度散点图#

来自这里

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import gaussian_kde

# Generate fake data
x = np.random.normal(size=1000)
y = x * 3 + np.random.normal(size=1000)

# Calculate the point density
xy = np.vstack([x,y])
z = gaussian_kde(xy)(xy)

# Sort the points by density, so that the densest points are plotted last
idx = z.argsort()
x, y, z = x[idx], y[idx], z[idx]

fig, ax = plt.subplots()
cax = ax.scatter(x, y, c=z, s=5, edgecolor='')
fig.colorbar(cax)
plt.show()

subplot中加上总标题#

plt.suptitle('This is a somewhat long figure title', fontsize=16)

subplot中加上总xylabel#

plt.gcf().text(0.5, 0.04, 'LDR', fontsize=17)
plt.subplots_adjust(left=0.07, right=0.93, top=0.85, bottom=0.15)

subplot中加上编号（子图相对位置统一）#

ax1 = plt.subplot(121)
plt.text(0.86, 0.89, '(a)', fontsize=14, transform = ax1.transAxes)

防止text重叠#

用adjustText包。

在一个数组中随机抽取元素的方法#

来自这里

import random
#使用python random模块的sample函数从列表中随机选择一组元素
list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
slice = random.sample(list, 5)  #从list中随机获取5个元素，作为一个片断返回  

Latex相关#

输出\num{3.2e-1}：\num{{{:3.1e}}}。

自己写包#

一直都想这么干了，之前的代码都是复制粘贴，觉得很没有效率；所以决定将常用的代码写成一个包方便调用。目标是想numpy一样有层级，同时只导入包名能用Tab提示下面层级的内容。

首先描述文件结构：

\ruler
  \ruler
    __init__.py
    convert.py
    \subpackage
      __init__.py
      something.py
  setup.py

因为还没完全写好，就先把一个示例放上来。最外面的ruler是安装用的，不叫包名应该也可以（但是如果要上传到PyPi的话应该有要求），里面的setup.py需要有这样的内容：

from setuptools import setup

setup(name='ruler',
      version='0.1',
      description='The ruler for spectra',
      url='',
      author='Mingjie Jian',
      author_email='ssaajianmingjie@gmail.com',
      license='MIT',
      packages=['ruler'],
      zip_safe=False)

如果只有name和version的话可能也行。第二层的ruler是真正的包，它以及里面的每个文件夹都需要有一个__init__.py，表示这是包。从这一级开始里面就可以放module，也就是.py文件了。不过要达到之前的目的（仅import包名但自动提示模块）需要在每一个__init__.py里面将对应文件夹包含的module以及子文件夹们import掉；比如ruler里面的要这样写：

from . import convert
from . import subpackage

当然subpackage里面的也需要这样写才能把所有的module都带上。想要测试的话先import然后用dir()看看module和子文件夹在不在里面就行。

这些搞定之后就可以跑回最外级的ruler里面打开终端，运行pip install -e .。-e的意思是--editable，每次更新之后不用再pip install就可以直接用了；之后把Jpynb重启一遍就行了。

参考资料：
Python Tutorial Chap. 6
How To Package Your Python Code
Python导入模块的几种姿势

Unbuntu备忘#

https://server.etutsplus.com/apt-get-404-not-found/

合并pdf pdftk file1.pdf file2.pdf cat output mergedfile.pdf

服务器备忘#

https://blog.einverne.info/archive.html

Git cz#

https://www.ruanyifeng.com/blog/2016/01/commit_message_change_log.html.

用Vim将代码批量打印成pdf#

假设现在有100个后缀为.f的Fortran代码放在同一个文件夹中，希望在带行标和语法高亮的情况下将它们批量转成pdf。

在~/.vimrc中添加：set printoptions=number:y
在文件夹中打开所有.f文件：vim *.f
在Vim中设置argument为所有.f文件：:arg *.f
在Vim中将所有.f文件输出成ps文件：:argdo set ei-=Syntax | do Syntax | hardcopy! > %.ps

退出vim，将ps文件转为pdf文件：

for f in *.ps; do
  ps2pdf "$f" "${f%.*}.pdf"
  echo "$f" # Command this out if not needed
done

ZSH 出现corrupt history file问题#

cp .zsh_history zsh_history
rm -f .zsh_history 
strings zsh_history .zsh_history

Ref

Jupyter Notebook + Python + Bash 备忘

Contents