51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 1229|回复: 4
打印 上一主题 下一主题

Python 下载amazon 主图图片

[复制链接]
  • TA的每日心情
    无聊
    4 天前
  • 签到天数: 530 天

    连续签到: 2 天

    [LV.9]测试副司令

    跳转到指定楼层
    1#
    发表于 2022-4-27 10:43:43 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    1测试积点

    1. import requests
    2. import xlwings
    3. from selenium import webdriver

    4. def download_image(image_url,ASIN):
    5.     #下载图片
    6.     resp = requests.get(image_url, headers=headers)
    7.     file_path = 'E:/Download/BASIN/' + ASIN + '.jpg'
    8.     with open(file_path,'wb') as f:
    9.         f.write(resp.content)

    10. def get_image_url(ASIN):
    11.     #获得图片地址
    12.     url = 'https://www.amazon.com/dp/' + ASIN
    13.     browser.get(url)
    14.     img_element = browser.find_element_by_xpath('.//div[@id="imgTagWrapperId"]/img')
    15.     image_url = img_element.get_attribute('data-old-hires')
    16.     return image_url

    17. app = xlwings.App()
    18. wb = app.books.open('E:/Download/BASIN/Casin.xlsx')
    19. ws = wb.sheets('1')
    20. ASINS = ws.range('a2:a3').value #打开excel文件读取需要爬取主图的asin
    21. browser = webdriver.Chrome()
    22. headers = {
    23.     'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36',
    24. }
    25. image_news = []
    26. for ASIN in ASINS:
    27.     print(ASINS.index(ASIN)+1, ASIN)
    28.     try:
    29.         image_url = get_image_url(ASIN)
    30.         download_image(image_url,ASIN)
    31.         image_news.append('已下载')
    32.     except:
    33.         image_news.append('没找到')

    34. ws.range('g2').options(transpose=True).value = image_news #在g列写下下载结果
    35. wb.save()
    36. app.quit()
    37. browser.close()
    复制代码
    上面的代码是我复制别人的来改的 就是改了文件路径
    下面是报错提示
    1. D:\Users\TY\AppData\Local\Programs\Python\Python310\python.exe C:/Users/TY/PycharmProjects/pythonProject5/main.py
    2. Traceback (most recent call last):
    3. File "C:\Users\TY\PycharmProjects\pythonProject5\main.py", line 22, in
    4. ws = wb.sheets('1')
    5. File "D:\Users\TY\AppData\Local\Programs\Python\Python310\lib\site-packages\xlwings\main.py", line 4893, incall
    6. return Sheet(impl=self.impl(name_or_index))
    7. File "D:\Users\TY\AppData\Local\Programs\Python\Python310\lib\site-packages\xlwings_xlwindows.py", line 877, in call
    8. return Sheet(xl=self.xl(name_or_index))
    9. File "D:\Users\TY\AppData\Local\Programs\Python\Python310\lib\site-packages\xlwings_xlwindows.py", line 208, in call
    10. v = self._inner(*args, **kwargs)
    11. File "C:\Users\TY\AppData\Local\Temp\gen_py\3.10\00020813-0000-0000-C000-000000000046x0x1x9.py", line 36625, incall
    12. ret = self.oleobj.InvokeTypes(0, LCID, 2, (9, 0), ((12, 1),),Index
    13. pywintypes.com_error: (-2147352567, '发生意外。', (0, None, None, None, 0, -2147352565), None)
    复制代码

    进程已结束,退出代码1

    ASIN在表格sheet1种
    有没有人帮我改下啊 谢谢


    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    2024-10-22 14:23
  • 签到天数: 1007 天

    连续签到: 1 天

    [LV.10]测试总司令

    2#
    发表于 2022-4-28 10:00:12 | 只看该作者
    加油!
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    3 天前
  • 签到天数: 1521 天

    连续签到: 5 天

    [LV.Master]测试大本营

    3#
    发表于 2022-4-28 11:19:46 | 只看该作者
    看是否是路径问题
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    前天 07:50
  • 签到天数: 2818 天

    连续签到: 6 天

    [LV.Master]测试大本营

    4#
    发表于 2022-4-28 16:46:31 | 只看该作者
    单步调呗
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    前天 08:51
  • 签到天数: 668 天

    连续签到: 6 天

    [LV.9]测试副司令

    5#
    发表于 2022-4-28 17:13:18 | 只看该作者
    这个男
    回复

    使用道具 举报

    本版积分规则

    关闭

    站长推荐上一条 /1 下一条

    小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

    GMT+8, 2024-11-25 06:29 , Processed in 0.070226 second(s), 22 queries .

    Powered by Discuz! X3.2

    © 2001-2024 Comsenz Inc.

    快速回复 返回顶部 返回列表