问题描述:
比如我需要收集公司全部员工的一些资料(比如健康码等公开资料),现在手上有个名单列表。
如果每个人都私发给我,还得自己保存、整理(重命名等)。
为了方便整理,于是,我就可以建个文件夹,在里面给每个人建个单独的文件夹,当然这些文件夹都是空的。
然后把整个文件夹上传到钉钉群就可以了。群成员找到文件夹里自己名字的文件夹,对应上传资料就行了。
问题描述:
比如我需要收集公司全部员工的一些资料(比如健康码等公开资料),现在手上有个名单列表。
如果每个人都私发给我,还得自己保存、整理(重命名等)。
为了方便整理,于是,我就可以建个文件夹,在里面给每个人建个单独的文件夹,当然这些文件夹都是空的。
然后把整个文件夹上传到钉钉群就可以了。群成员找到文件夹里自己名字的文件夹,对应上传资料就行了。
站点地图是一种xml文件,可以通过该文件列出网站上的网页,从而将网站内容的组织架构告知Google和其他搜索引擎。Sitemap 可方便管理员通知搜索引擎他们网站上有哪些可供抓取的网页。搜索引擎网页抓取工具会读取此文件,以便更加智能地抓取您的网站。
向搜索引擎提交自己hexo博客的sitemap,有助于让别人更好地通过搜索引擎搜索到自己的博客。
原文章写于:2021年02月20日
本来想升级下 selenium,原来用的3,现在准备改代码换成4的版本。结果发现现在都会检测是selenium webdriver,不让代码登录了。
于是,又重新折腾了下。
之前总是担心某一天豆瓣撑不下去了会倒闭。于是,总想着把自己在豆瓣标记的读过的书,看过的电影都备份存下来,主要还有一些看完当时的短评记录。
电影的页面和读书的页面差不多的,所以这里就介绍一下备份读过的书的方法。
最终存到Excel表格中和数据库(sqlite)表中。
Hexo博客中所有的文章都是经过渲染的静态网页。
所以,当我有个自定义的页面(比如a.html要放在根目录下),想跳过渲染,就需要设置下。
Hexo跳过渲染 方法:
修改Hexo目录的配置文件(_config.yml
)
搜索找到 skip_render
这一项进行配置即可。
我的Hexo博客已经部署到云服务器上了,部署过程看此文:Hexo博客部署到云服务器(Ubuntu)上
然后,因为原来是用的Github Pages,就想着顺便同步到Github Pages上吧。
为什么要安装SSL证书,如果没有SSL证书,访问网站的时候,前面会有个小叹号,是用 http://www.hduzn.cn
这样的域名访问的。如果部署了SSL,访问的时候、域名前面就有个安全锁的小图标了。是用 https://www.hduzn.cn
这样的地址访问的。
反正都可以免费申请SSL证书的,就申请了下。
PIL(Python Imaging Library)是Python的第三方图像处理库,但由于其强大的功能,事实上已经被认为是图像处理标准库了。PIL功能非常强大,而且API却非常简单易用。
由于PIL仅支持到Python 2.7,加上年久失修,于是一群志愿者在PIL的基础上创建了兼容的版本,名字叫Pillow,支持最新Python 3.x,又加入了许多新特性,因此,我们可以直接安装使用Pillow。
Docker 是一个开源的应用容器引擎。
也可以把它理解为一个轻量的虚拟机,它只虚拟你软件需要的运行环境,多余的一点都不要;而普通虚拟机则是一个完整而庞大的系统,包含各种不管你要不要的软件。
Docker 入门教程:
https://www.runoob.com/docker/docker-tutorial.html
https://docker.easydoc.net/doc/81170005/cCewZWoN/lTKfePfP
正则表达式是什么?
正则表达式(regular expression) 描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
比如:
col+r
:可以匹配 color、colour、colouur 等,+ 号代表前面的字符至少出现一次1次或多次;col*r
:可以匹配 colr、color、colour 等,*
号代表前面的字符可以0次或多次;col?r
: 可以匹配 colr 或者 color,? 问号代表前面的字符可以出现0次或1次。关于怎么安装使用Selenium,看这篇文章: Python Selenium使用举例
Selenium用法 主要就4步:
这篇文章主要针对第3步,列举一些查找元素的方法。(文章代码中使用selenium4版本)