当前位置:首页 » 操作系统 » R查源码

R查源码

发布时间: 2025-08-04 01:37:44

① 如何使用python或R抓取网页被隐藏的源代码

隐藏的源代码?不知道你指的是什么?我的理解有两种,一是不在前段显示,但是查看源代码时有,二是,异步加载的内容在前端和源代码中均看不到,第一种很容易解决,想必你指的时第二种,解决方法有三种:

  1. 模拟浏览器,动态获取,可以使用大杀器selenium工具

    使用这种方法可以实现只要能看到就能抓取到,如鼠标滑过,异步加载等,因为他的行为可以与浏览器一模一样,但是这种方式的效率却是最低的,一般不到实在没有办法的时候不推荐使用。

  2. 执行js代码

    在python中执行异步加载的js代码,获得一些诸如鼠标滑过,下拉加载更多等,但是现在的网站中都有非常多的js代码,要找到需要执行的目标js代码时非常困难和耗时的,此外python对js的兼容性也不是很好,也不推荐使用。

  3. 找到异步加载的json文件,最常用,最方便,最好用的方法,这是我平常抓取动态异步加载网站时最常用的方法,可以解决我99%的问题。具体的使用方法是打开浏览器的开发者工具,转到network选项,之后重新加载网页,在network中的列表中找到加载过程中加载的需要动态异步加载的json文件,以京东为例,如图,第一张找到的是异步加载的库存信息的json文件,第二招找到的是异步加载的评论信息的json文件:

具体更详细的方法可以google或网络

② 我想知道如何查看python的源代码

查看脚本的话(python中部分函数是直接用C语言嵌入的,要在官网上搜C源码),可以使用Pycharm,或者其他IDLE,比如我想查看python中TensorFlow包的Session函数:

  1. 任意在pycharm内的一个.py文件中,输入这个函数

    import tensorFlow as tf #载入包并命名为tf

    tf.Session()

  2. 然后按住Ctrl按钮,左键单击Session,就自动打开了对应.py文件

另外一种方法是直接在python本地库中找对应的.py文件,(可以用help函数先搜索)

③ 怎么才能查看R语言某个包某函数源码

如果是程序包中自己带的函数,可用以下操作:

  1. https://cran.r-project.org/

  2. 点击左侧Packages

  3. 点击中间Table of available packages, sorted by date of publication链接,进入包的列表界面

  4. ctrl+F组合键在网页中搜索你关心的R包,例如包WGCNA,点击进入此R包主界面

  5. 点击Downloads下面的Packagesource:
    WGCNA_1.51.tar.gz

  6. 解压此包,然后找到里面名字为R的文件夹,里面都是R语言包中包含的R的函数的代码

如果是在bioconctor中的包,可以在bioconctor官网中搜索此R包,进入此包界面,下载.tar.gz的这个文件,寻找方法如上.

热点内容
java返回this 发布:2025-10-20 08:28:16 浏览:585
制作脚本网站 发布:2025-10-20 08:17:34 浏览:881
python中的init方法 发布:2025-10-20 08:17:33 浏览:574
图案密码什么意思 发布:2025-10-20 08:16:56 浏览:761
怎么清理微信视频缓存 发布:2025-10-20 08:12:37 浏览:677
c语言编译器怎么看执行过程 发布:2025-10-20 08:00:32 浏览:1005
邮箱如何填写发信服务器 发布:2025-10-20 07:45:27 浏览:250
shell脚本入门案例 发布:2025-10-20 07:44:45 浏览:108
怎么上传照片浏览上传 发布:2025-10-20 07:44:03 浏览:799
python股票数据获取 发布:2025-10-20 07:39:44 浏览:705