博客文章

630 篇文章

DADealiAxy

关于老码农的小说《码农故事》

内容简介 一群年轻人的创业故事,从一家小公司逐步发展成为一家经营稳定的大公司的故事。 志同道合的人分分合合,最终各得其所。 主要人物 主要几个精彩的情节 赵川、段倩、莫楠、裴曼的小聚会 感觉这个阶段的情节,氛围是最好的。 当时他们的公司还很小,几个创始人在一起玩的很好,没有什么拘束。 赵川、莫楠通宵加班轮流写代码 这种钻研技术的精神也是很令人佩服,还有共事多年的朋友一起,虽然莫楠与赵川是员工与老板

12-18
2023-01-16
8134
DADealiAxy

【曦远读书】50年后的中国和400年后的世界

前言 最近真的好久好久没有更新博客和公众号了,特别我这个新开的分享生活的公众号,自从三月底把去年拍的看鱼的照片发上来之后至今都没有发新推文…… 有小伙伴说我那个技术的公众号更新得很勤但是这个号不怎么更新,肯定是没有生活的技术宅,倒不是说没有生活可以分享,其实我每周都会有很多想分享的内容记在了todo list上,结果……又忙又懒,就一直拖着没写了。 初识 本文要介绍的是黑曜圣石大佬的《太阳的距离》

12-18
2021-12-18
1450
DADealiAxy

《围城》片段笔记

前言 几个星期前写了《围城》的简评,为了尽量精简语言,就没有把摘选的笔记放进去。 这次把之前摘选的片段做一个小结。也许以后会添加新的片段。 片段 他想现在想到重逢唐晓芙的可能性,木然无动于中,真见了面,准也如此。缘故是一年前爱她的自己早死了,爱好,怕苏文纨,给鲍小姐诱惑这许多自己,一个个全死了。有几个死掉的自己埋葬在记里,立碑志墓,偶一凭吊,像对唐晓芙的一番情感,有几个自己,仿佛是路毙的,不去收拾

12-18
2022-06-17
1188
DADealiAxy

一个玄学的爬虫bug竟让我放弃Python语言!?背后的原因令人唏嘘~

每一位成功的程序员,背后也许都站着无数秃头的男人——为其提供各种开发工具&代码库,当然也包括…… 各种玄学bug…… 玄学的开端 最近在用Python做一个爬虫项目的时候遇到一个很奇怪的问题,而且还不是每次都会触发,实在是令人费解…… 报错信息如下: UnicodeEncodeError: 'latin-1' codec can't encode character '\u2026' in pos

12-18
2021-12-18
100
爬虫
DADealiAxy

Selenium爬虫实践:ajax请求抓包、浏览器退出

前言 最近在搞公司内部系统,累的一批,需要从另一个内部系统导出数据存到数据库做分析,有大量的数据采集工作,又没办法去直接拿到那个系统的接口,太难了,只能爬虫,但是cookie还经常失效,为了不每次登录失效就来找我重新注入Cookie,我写了一个手机版的网页,用来控制后台的selenium自动登录,截取token和cookie。 ajax请求抓包方案 搜索资料的过程真的痛苦,不过还好这时间没有白花,

12-18
2022-05-27
4566
爬虫
DADealiAxy

Selenium爬虫实战:截取网页上的图片

前言 同样是为了刷课,没想到工作后依然和大学一样逃脱不了需要刷网课的命运…… 正文 直接说干货了,截取图片,需要截取的图片是什么图片大家都懂(说的就是你,验证码),其他图片的话不需要截取,直接拿到地址下载就行,验证码不行,同样的地址再访问一次内容就变了。 我不知道为啥selenium不能直接把特定img元素的图片拿出来,太反人类了。 根据我找到的资料,主要有两种思路,一种是模拟鼠标操作,在验证码上

12-18
2022-05-27
7657
爬虫
86 页,共 105
每页: