麦晓杰

生活充满了选择,而生活的态度就是一切。

Scroll Down

使用"浏览器脚本注入"进行数据采集

昨天想去极客时间把购买的一个专栏里的数据扒下来,发现之前写的python脚本不能用了,原因是他们网站做了限流、也加了http时间戳的一些校验。我们可以将之前的python脚本进行改进,用ip代理池来处理限流,寻找时间戳验证的规则就可以解决。但是这次我们用了另外的一种爬虫的思路,就是我们直接写一些js

#前端   #数据采集  

深入学习二叉树和二叉查找树

树是计算机科学中经常用到的一种数据结构。树是一种非线性的数据结构,以分层的方式存储数据。树被用来存储具有层级关系的数据,比如文件系统中的文件。树还可以用来存储有序列表。树的定义树是由一组以边连接的节点组成。公司的组织结构图就是一个树的例子。组织结构图就是一种树一棵树最上面的节点成为根节点。如果一个节

#算法   #二叉树  

nodejs在自然语言处理中的应用

nodejs做自然语言处理是非常可行的,这次我做了一些小小的尝试,一起来体验一下吧。因为还保持着对自然语言处理的那份热爱,最近没事的时候会把毕业论文翻出来看(毕业论文的课题就是关于自然语言处理的),然后在我的新博客中加入了一些相关的处理,主要做了以下几个方面:对每一篇文章进行快速的内容理解,根据标题

#算法   #自然语言处理   #nlp   #nodejs  

js音乐播放器的实现以及可视化

前言我们尝试用原生js写一个音乐播放器,对音频做一个简单的可视化。最终的效果如下图:思路还是比较明显的,第一,我们要拿到音频的什么数据进行可视化,如何获取?第二,如何可视化,第二个问题就比较简单了,用canvas来操作。获取音频相关的数据可以用 Web Audio API , 这里我们可以去 MDN

#前端   #播放器