Node爬取数据到数据库练习

这里爬取了一个api接口里面的所有数据到本地。

数据库:

建表:

image-20200428164044158

字段:

image-20200428164359391

代码实例

请求 axios mysql 模块需要先 npm install

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
let axios = require('axios')
let mysql = require('mysql')

// *********************************//
// ******** 封装网络请求 ************//
// *********************************//
// 数据请求
function request(config) {
const instance = axios.create({
baseURL: 'http://XXXXXXXXXXXXXX',
timeout: 5000
})
instance.interceptors.request.use(config => {
return config
}, err => {
console.log(err);
})
instance.interceptors.response.use(res => {
return res.data
}, err => {
console.log(err);
})
return instance(config)
}

// 获取首页数据:multidata,data
function getHomeMultidata() {
return request({
url: '/home/multidata'
})
}

function getHomeGoods(type,page) {
return request({
url:'/home/data',
params: {
type,
page
}
})
}

// 获取详情页数据
function getDetail(iid) {
return request({
url: '/detail',
params: {
iid
}
})
}

function getRecommend() {
return request({
url: '/recommend'
})
}

// 获取分类页数据
function getCategory() {
return request({
url: '/category'
})
}

function getSubcategory(maitKey) {
return request({
url: '/subcategory',
params: {
maitKey
}
})
}

function getCategoryDetail(miniWallkey, type) {
return request({
url: '/subcategory/detail',
params: {
miniWallkey,
type
}
})
}

// 等待函数,防止访问速度过快造成的数据读取失败
function wait(millSeconds) {
return new Promise(function(resolve,reject){
setTimeout(() => {
resolve('成功执行延迟函数,延迟时间:' + millSeconds)
}, millSeconds);
})
}

// *********************************//
// ********** 连接数据库 ************//
// *********************************//

let sqlOptions = {
host: 'localhost',
port: '3306',
user: 'root',
password: '123456',
database: 'mall'
}
let con = mysql.createConnection(sqlOptions)
con.connect();

// *********************************//
// ********* 开始爬取数据 ***********//
// *********************************//

// 爬取首页Multidata数据
async function homeMultidata() {
let res = await getHomeMultidata()
let data = await JSON.stringify(res)
// 写入数据
let srtSql = "insert into home_multidata (data) values (?)"
con.query(srtSql,data, (err,res)=>{
if(err){
console.log("错误信息:" + err);
}else{
console.log("写入成功");}
})
console.log("全部写入完成");
}

// 爬取首页data数据,因为三个分类(pop.sell,new)存在页数不同的问题,这里我分成2个函数来写,本来想加个判断的,这样能用,就先这样写着吧
async function homeDataPop(thisType){
// 循环一下页数
for (let page = 1; page <= 50; page++) {
await wait(200*page)
let type = thisType
let res = await getHomeGoods(type,page)
let data = await JSON.stringify(res)
// 写入数据
let arr = [type,page,data]
let srtSql = "insert into home_data (type,page,data) values (?,?,?)"
con.query(srtSql, arr, (err,res)=>{
if(err){
console.log("错误信息:" + err);
}else{
console.log(type +',第'+ page + '页,数据写入成功');
}
})
}
console.log("全部写入完成");
}

async function homeDataSell(sell){
// 循环一下页数
for (let page = 1; page <= 20; page++) {
await wait(200*page)
let type = sell
let res = await getHomeGoods(type,page)
let data = await JSON.stringify(res)
// 写入数据
let arr = [type,page,data]
let srtSql = "insert into home_data (type,page,data) values (?,?,?)"
con.query(srtSql, arr, (err,res)=>{
if(err){
console.log("错误信息:" + err);
}else{
console.log(type +',第'+ page + '页,数据写入成功');
}
})
}
console.log("全部写入完成");
}

// 获取detail详情页的数据,还是分开来写,里面好像有很多重复的数据
async function detailDataPop(thisType){
// 循环一下页数
for (let page = 1; page <= 50; page++) {
await wait(200*page)
let type = thisType
let res = await getHomeGoods(type,page)
let iidList = res.data.list
iidList.forEach(async (item,i) =>{
await wait(200*i)
let iid = item.iid
let res = await getDetail(iid)
let data = await JSON.stringify(res)
let arr = [iid,data]
let srtSql = "insert into detail (iid,data) values (?,?)"
con.query(srtSql, arr, (err,res)=>{
if(err){
console.log("错误信息:" + err);
}else{
console.log( iid + ',数据写入成功');
}
})
})
}
console.log("全部写入完成");

}

async function detailDataSell(sell){
// 循环一下页数
for (let page = 1; page <= 20; page++) {
await wait(200*page)
let type = sell
let res = await getHomeGoods(type,page)
let iidList = res.data.list
iidList.forEach(async (item,i) =>{
await wait(200*i)
let iid = item.iid
let res = await getDetail(iid)
let data = await JSON.stringify(res)
let arr = [iid,data]
let srtSql = "insert into detail (iid,data) values (?,?)"
con.query(srtSql, arr, (err,res)=>{
if(err){
console.log("错误信息:" + err);
}else{
console.log( iid + ',数据写入成功');
}
})
})
}
console.log("全部写入完成");
}

// 获取recommend数据
async function recommendData() {
let res = await getRecommend()
let data = await JSON.stringify(res)
// 写入数据
let srtSql = "insert into recommend (data) values (?)"
con.query(srtSql,data, (err,res)=>{
if(err){
console.log("错误信息:" + err);
}else{
console.log("写入成功");}
})
console.log("全部写入完成");
}

// 获取分类页数据
async function categoryData() {
let res = await getCategory()
let data = await JSON.stringify(res)
// 写入数据
let srtSql = "insert into category (data) values (?)"
con.query(srtSql,data, (err,res)=>{
if(err){
console.log("错误信息:" + err);
}else{
console.log("写入成功");}
})
console.log("全部写入完成");
}
// 获取Subcategory数据
async function subcategoryData() {
let res = await getCategory()
let list = res.data.category.list
list.forEach(async (item,i) => {
await wait(200*i)
let maitKey = item.maitKey
let res = await getSubcategory(maitKey)
let data = JSON.stringify(res)
let arr = [maitKey,data]
let srtSql = "insert into subcategory (maitKey,data) values (?,?)"
con.query(srtSql, arr, (err,res)=>{
if(err){
console.log("错误信息:" + err);
}else{
console.log(maitKey + ',数据写入成功');
}
})
});
console.log("全部写入完成");
}

// 获取CategoryDetail数据
async function categoryDetailData() {
let res = await getCategory()
let list = res.data.category.list
list.forEach(async (item,i) => {
await wait(200*i)
let miniWallkey = item.miniWallkey
let types = ['pop','new','sell']
types.forEach(async (type,i) => {
await wait(200*i)
let res = await getCategoryDetail(miniWallkey, type)
let data = await JSON.stringify(res)
let arr = [miniWallkey,type,data]
let srtSql = "insert into subcategory_detail (miniWallkey,type,data) values (?,?,?)"
con.query(srtSql, arr, (err,res)=>{
if(err){
console.log("错误信息:" + err);
}else{
console.log( miniWallkey + ',数据写入成功');
}
})
});

});
console.log("全部写入完成");
}



// 爬取数据
// homeMultidata()
// homeDataPop('pop')
// homeDataPop('new')
// homeDataSell('sell')
// detailDataPop('pop')
// detailDataPop('new')
// detailDataSell('sell')
// recommendData()
// categoryData()
// subcategoryData()
// categoryDetailData()
------ 本文结束  感谢阅读 ------