新書推薦:

《
文化的曜变:日本国宝中的唐风汉骨
》
售價:HK$
86.9

《
好孕,从卵子开始(第3版)
》
售價:HK$
86.9

《
父母会规划,孩子能成才
》
售價:HK$
65.8

《
为何家会伤人(2025版) 新增1.5万字“原生家庭20问” 知名心理学者武志红代表作
》
售價:HK$
68.2

《
戈特曼情感大师系列6册:爱的沟通+幸福的婚姻+幸福的家庭+幸福婚姻的10大敌人+爱的博弈+当婚姻中有了孩子
》
售價:HK$
659.3

《
吐司三明治自己做最好吃:102款花样吐司+85款爆款三明治+11款轻食沙拉+5款灵魂抹酱
》
售價:HK$
43.8

《
DK马术全书(全新升级版)
》
售價:HK$
262.9

《
货币之手
》
售價:HK$
142.9
|
編輯推薦: |
让零基础小白掌握Python爬虫技术用ChatGPT自动生成爬虫代码掌握AI工具在编程中的应用,革新编程方式,改变编程思维
|
內容簡介: |
全书共11章,以下是各章的主要内容:
來源:香港大書城megBookStore,http://www.megbook.com.hk 第1章:主要讲解Python编程环境的搭建方法及Python语言的基础语法知识等内容。
第2章:主要讲解AI工具的基本使用方法,以及如何在爬虫编程中利用AI工具解决技术难题和提高开发效率。
第3章:主要讲解如何对网页进行初步分析,包括查看网页源代码、剖析网页的结构、判断网页的类型等,为获取网页源代码并提取数据奠定基础。
第4、5章:分别讲解静态网页和动态网页的爬取,主要内容包括如何使用Requests模块和Selenium模块获取网页源代码,如何使用正则表达式和BeautifulSoup模块从网页源代码中提取所需数据。
第6章:主要讲解如何使用pandas等模块对获取的数据进行清洗、处理和分析,以提高数据的质量,并从数据中提取有价值的信息。
第7章:进一步探索Python网络爬虫的进阶技术,例如,用pandas模块爬取网页表格数据、用数据接口爬取数据、开发带图形用户界面的爬虫程序等。
第8~11章:通过一系列实际应用场景来实践并强化之前所学的知识。这些场景涵盖了财经、社交媒体、电商等多个领域的数据爬取,以及媒体文件的下载。读者将深入体会如何灵活运用爬虫技术解决实际问题,在遇到困难时如何借助AI工具“见招拆招”,从而踏上编程能力的持续自我提升之路。
|
內容試閱:
|
◆ 前言 ◆
网络爬虫是一种高效的数据采集工具,然而对于许多初学者而言,这项技术似乎遥不可及,需要具备高深的编程技能才能掌握。本书旨在探讨如何通过简洁易懂的Python编程语言与先进AI工具的“强强联手”,降低爬虫技术的学习门槛,让学习过程变得轻松愉快。
◎内容结构
全书共11章,以下是各章的主要内容:
第1章:主要讲解Python编程环境的搭建方法及Python语言的基础语法知识等内容。
第2章:主要讲解AI工具的基本使用方法,以及如何在爬虫编程中利用AI工具解决技术难题和提高开发效率。
第3章:主要讲解如何对网页进行初步分析,包括查看网页源代码、剖析网页的结构、判断网页的类型等,为获取网页源代码并提取数据奠定基础。
第4、5章:分别讲解静态网页和动态网页的爬取,主要内容包括如何使用Requests模块和Selenium模块获取网页源代码,如何使用正则表达式和BeautifulSoup模块从网页源代码中提取所需数据。
第6章:主要讲解如何使用pandas等模块对获取的数据进行清洗、处理和分析,以提高数据的质量,并从数据中提取有价值的信息。
第7章:进一步探索Python网络爬虫的进阶技术,例如,用pandas模块爬取网页表格数据、用数据接口爬取数据、开发带图形用户界面的爬虫程序等。
第8~11章:通过一系列实际应用场景来实践并强化之前所学的知识。这些场景涵盖了财经、社交媒体、电商等多个领域的数据爬取,以及媒体文件的下载。读者将深入体会如何灵活运用爬虫技术解决实际问题,在遇到困难时如何借助AI工具“见招拆招”,从而踏上编程能力的持续自我提升之路。
◎读者对象
本书适合需要在网络数据的采集、处理与分析方面提高效率的职场人士和办公人员阅读,也可供Python编程爱好者参考。
由于AI技术和编程技术的更新和升级速度很快,加之编者水平有限,本书难免有不足之处,恳请广大读者批评指正。
|
|