煮豆燃豆萁...means what

七步诗

煮豆燃豆萁
豆在釜中泣
本是同根生
相煎何太急

story

The king is trying to kill his brother and gave mercy only if the brother made a poem in 7 steps that can change his mind. And it happened. Burning the dried beanstalks to cook beans, beans are crying in the pot, we are from the same family same root, why rush to kill each other

厂商流量包套餐和带宽换算

流量包套餐和带宽换算

带宽

  • 网络术语的带宽指在中通常指64kbit/s以上信号的数字通信
  • 相对的被大众遗忘的概念'窄带': 64kbit/s以下信号数字通信

带宽传输速率

带宽下载速度公式月最大流量(传输速率x60x60x24x30, 2592000秒)
带宽为2Mb下载速度为256KB/s2 / 8 = 0.25约632G
带宽为4Mb下载速度为512KB/s4 / 8 = 0.51.2T
带宽为8Mb下载速度为1.00MB/s8 / 8= 1.02.47T
带宽为10Mb下载速度为1.25MB/s10 / 8 = 1.253.08T
带宽为20Mb下载速度为2.50MB/s20 / 8 = 2.506.17T
带宽为100Mb下载速度为12.5MB/s100 / 8 = 12.5030.9T

流量套餐换算等效带宽

  • 流量套餐传输速率仅受硬件条件限制,除非厂商特别说明限制传输上限
  • 换算等效带宽无实际意义,根据需根据流量实际情况选择

BeautifulSoup解析器lxml、html5lib和默认解析器区别

使用BeautifulSoup 解析网页学简笔画网chengyu/19601.html, 发现常用的lxml解析器解析缺失<div class="footer">内容, 决定一探究竟,记录下结论

lxml

  • 解析器速度最快, 能默认处理类似<a></b>这类错误,自动识别为<a></a>
  • 对于简单的不正确闭合能自动纠正,稍微复杂的闭合错误会出现解析失败内容缺失的情况,复杂情况未正确闭合内容会默认剔除
  • lxml会读取meta中的charset编码类型,自动转换为utf-8,当设置编码与实际编码不一致也会导致内容缺失,如指定了编码<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />, 实际内容非gb2312编码,遇到汉字字符解析失败,内容就只有前几行兼容ascii编码内容

hmtl5lib

  • 安装pip3 install html5lib
  • 对未正确关闭标签,有较好的兼容性
  • 对charset不符实际编码会按指定编码强制转换,与lxml省略不一样

默认html.parser

  • 解析速度不如前两者
  • 不自动不全<head></head> 基本Doc 元素
  • 不识别 meta编码,统一按utf-8读取,对中文网站解析不友好

解析结果对比 html5lib (左) lxml(右)

请输入图片描述请输入图片描述

ipython崩溃异常退出解决办法

ipython

  • ipython是一个非常实用的交互软件, 能帮助python coder快速实时的看到运行结果,但随着版本更新,不可避免出现一些意想不到的情况,比如ipython3.6.8之后的版本安装总会遇到'''AttributeError: 'TypeError' object has no attribute 'tb_frame'''这样的报错
  • 总结解决办法, 如果有其它项目或工程依赖jedi,请谨慎删除
    '''

pip3 uninstall jedi --yes
'''

sed脚本技巧-在匹配内容后追加

SED编辑器修改文本,在匹配内容后追加

  • 最近使用宝塔建站,网址比较多的时候修改起来比较费时间,搞个shell脚本批量处理,实现功能 access_log /path/abc/file.log; 指定日志格式
sed -i 's#access_log.*\.log#& ngx_log#g'  /path/abc/file.log
  • 知识点: &用来表示模式匹配(正则表达式匹配)的范围