首页
笔记
项目
软件下载
归档
阅读网
友情链接
留言板
1
再见了,阅读网
2
goaccess报错 Token 'xx/xx/xx' doesn't match specifier '%d' 解决办法
3
为什么mysql的delete操作不释放磁盘空间
4
易时代统计 - 广告联盟 - 评测
5
vuetify 图片懒加载 移除模糊效果
luoxx
只要思想不滑坡,办法总比困难多
累计撰写
25
篇文章
累计创建
40
个标签
累计收到
76
条评论
栏目
首页
笔记
项目
软件下载
归档
阅读网
友情链接
留言板
搜索
标签搜索
广告联盟
vuetify
jsoup
爬虫
mysql
语音合成
讯飞
cleanmymac
imazing
pd
软件下载
synergy
windows
mac
Gravatar
css
stylus
谷歌搜索
nginx
halo集群
halo
http代理
socks5限速
socks5
腾讯云
mount
ohmyzsh
zsh
centos
puppeteer
seo
utools
react
vue
数据库
datagrip
springboot
linux
javascript
java
目 录
CONTENT
以下是
jsoup
相关的文章
2022-05-24
js 格式化文章格式(字符串多个换行合并)
爬虫爬到的文章格式千奇百怪,格式一点都不整齐,非常不美观。前端需要特殊处理才能使文章内容格式整齐。前言jsoup爬虫从网页上爬到的文章内容,保存到数据库的之后才发现格式千奇百怪,基本上没办法通过单个正则表达式来概括并且完全格式化这些文章,所以只能在前端做处理,拿到文章内容后在前端代码里面吧内容格式调
2022-05-24
231
0
1
笔记
2022-05-07
解决Jsoup抓取网页部分中文乱码(生僻字、繁体字)乱码
偶然发现我用jsoup爬的内容,有一部分中文里面有个别�乱码,但是同一个网页绝大部分中文都是正常的,只有极个别乱码,几经周折终于解决了这个问题,记录以备查查找问题对比源网页,发现乱码的地方都是一些生僻字或者繁体字,比如 ”郃“ 、 ”祂“ 、 ”個“所以我几度怀疑是我的linux服务器字体不全导致的
2022-05-07
300
0
0
笔记