新書推薦:

《
明宫彤史:明代宫廷女性(一部好看又严谨的明代宫闱秘史)
》
售價:HK$
107.8

《
十九日极夜.完结篇
》
售價:HK$
60.5

《
诗经译注(彩图珍藏本)
》
售價:HK$
217.8

《
新中式服装设计、制板与裁剪
》
售價:HK$
96.8

《
清末民初的“问题”与“主义”
》
售價:HK$
104.5

《
广西常用动物类中药
》
售價:HK$
107.8

《
全生命周期动作发展 第7版
》
售價:HK$
272.8

《
广岛 普利策奖得主首次揭示原子弹爆炸真相 20世纪美国百佳新闻作品TOP1
》
售價:HK$
63.8
|
編輯推薦: |
让零基础小白掌握Python爬虫技术用ChatGPT自动生成爬虫代码掌握AI工具在编程中的应用,革新编程方式,改变编程思维
|
內容簡介: |
全书共11章,以下是各章的主要内容:
來源:香港大書城megBookStore,http://www.megbook.com.hk 第1章:主要讲解Python编程环境的搭建方法及Python语言的基础语法知识等内容。
第2章:主要讲解AI工具的基本使用方法,以及如何在爬虫编程中利用AI工具解决技术难题和提高开发效率。
第3章:主要讲解如何对网页进行初步分析,包括查看网页源代码、剖析网页的结构、判断网页的类型等,为获取网页源代码并提取数据奠定基础。
第4、5章:分别讲解静态网页和动态网页的爬取,主要内容包括如何使用Requests模块和Selenium模块获取网页源代码,如何使用正则表达式和BeautifulSoup模块从网页源代码中提取所需数据。
第6章:主要讲解如何使用pandas等模块对获取的数据进行清洗、处理和分析,以提高数据的质量,并从数据中提取有价值的信息。
第7章:进一步探索Python网络爬虫的进阶技术,例如,用pandas模块爬取网页表格数据、用数据接口爬取数据、开发带图形用户界面的爬虫程序等。
第8~11章:通过一系列实际应用场景来实践并强化之前所学的知识。这些场景涵盖了财经、社交媒体、电商等多个领域的数据爬取,以及媒体文件的下载。读者将深入体会如何灵活运用爬虫技术解决实际问题,在遇到困难时如何借助AI工具“见招拆招”,从而踏上编程能力的持续自我提升之路。
|
內容試閱:
|
◆ 前言 ◆
网络爬虫是一种高效的数据采集工具,然而对于许多初学者而言,这项技术似乎遥不可及,需要具备高深的编程技能才能掌握。本书旨在探讨如何通过简洁易懂的Python编程语言与先进AI工具的“强强联手”,降低爬虫技术的学习门槛,让学习过程变得轻松愉快。
◎内容结构
全书共11章,以下是各章的主要内容:
第1章:主要讲解Python编程环境的搭建方法及Python语言的基础语法知识等内容。
第2章:主要讲解AI工具的基本使用方法,以及如何在爬虫编程中利用AI工具解决技术难题和提高开发效率。
第3章:主要讲解如何对网页进行初步分析,包括查看网页源代码、剖析网页的结构、判断网页的类型等,为获取网页源代码并提取数据奠定基础。
第4、5章:分别讲解静态网页和动态网页的爬取,主要内容包括如何使用Requests模块和Selenium模块获取网页源代码,如何使用正则表达式和BeautifulSoup模块从网页源代码中提取所需数据。
第6章:主要讲解如何使用pandas等模块对获取的数据进行清洗、处理和分析,以提高数据的质量,并从数据中提取有价值的信息。
第7章:进一步探索Python网络爬虫的进阶技术,例如,用pandas模块爬取网页表格数据、用数据接口爬取数据、开发带图形用户界面的爬虫程序等。
第8~11章:通过一系列实际应用场景来实践并强化之前所学的知识。这些场景涵盖了财经、社交媒体、电商等多个领域的数据爬取,以及媒体文件的下载。读者将深入体会如何灵活运用爬虫技术解决实际问题,在遇到困难时如何借助AI工具“见招拆招”,从而踏上编程能力的持续自我提升之路。
◎读者对象
本书适合需要在网络数据的采集、处理与分析方面提高效率的职场人士和办公人员阅读,也可供Python编程爱好者参考。
由于AI技术和编程技术的更新和升级速度很快,加之编者水平有限,本书难免有不足之处,恳请广大读者批评指正。
|
|