编程语言
首页 > 编程语言> > 使用Requests模块登录网站的Python 3脚本

使用Requests模块登录网站的Python 3脚本

作者:互联网

我正在尝试编写一些Python(3.3.2)代码以使用“请求”模块登录网站.这是登录页面的表单部分:

<form method="post" action="https://www.ibvpn.com/billing/dologin.php" name="frmlogin">
<input type="hidden" name="token" value="236647d2da7c8408ceb78178ba03876ea1f2b687" />

<div class="logincontainer">

    <fieldset>

        <div class="clearfix">
            <label for="username">Email Address:</label>
            <div class="input">
                <input class="xlarge" name="username" id="username" type="text" />
            </div>
        </div>

        <div class="clearfix">
            <label for="password">Password:</label>
            <div class="input">
                <input class="xlarge" name="password" id="password" type="password"/>
            </div>
        </div>

        <div align="center">

          <p>
                <input type="checkbox" name="rememberme" /> Remember Me
            </p>

          <p><a href="pwreset.php">Request a Password Reset</a></p>
        </div>

    </fieldset>

</div>

<div class="actions">
<input type="submit" class="btn primary" value="Login" />
</div>

</form>

这是我的代码,试图处理隐藏的输入:

import requests
from bs4 import BeautifulSoup

url = 'https://www.ibvpn.com/billing/clientarea.php'

body = {'username':'my email address','password':'my password'}

s = requests.Session()

loginPage = s.get(url)

soup = BeautifulSoup(loginPage.text)

hiddenInputs = soup.findAll(name = 'input', type = 'hidden')

for hidden in hiddenInputs:
    name = hidden['name']
    value = hidden['value']
    body[name] = value

r = s.post(url, data = body)

这仅返回登录页面.如果我将登录数据发布到“操作”字段中的URL,则会收到404错误.

我在StackExchange上看到过其他帖子,其中自动cookie处理似乎不起作用,因此我也尝试过使用以下方法手动处理cookie:

cookies = dict(loginPage.cookies)

r = s.post(url, data = body, cookies = cookies)

但这也只返回登录页面.

我不知道这是否与问题有关,但是在运行上述代码的任意一种之后,输入r.cookies会返回<<< class'requests.cookies.RequestsCookieJar'> []>

如果有人有任何建议,我很想听听他们的建议.

解决方法:

您正在加载错误的URL.该表单具有一个动作属性:

<form method="post" action="https://www.ibvpn.com/billing/dologin.php" name="frmlogin">

因此您必须将登录信息发布到:

https://www.ibvpn.com/billing/dologin.php

而不是发回到登录页面. POST到soup.form [‘action’]代替:

r = s.post(soup.form['action'], data=body)

您的代码可以很好地处理Cookie.例如,我可以看到s.cookies在请求登录表单后保存了一个cookie.

如果仍然无法执行此操作(返回404),则表明服务器正在使用其他技术来检测脚本,而不是真正的浏览器.通常,这是通过解析请求标头完成的.查看您的浏览器标头并复制它们.它们可能只是他们解析的User-Agent标头,但是Accept- *标头和Referrer也可以发挥作用.

标签:python-3-x,cookies,python-requests,python
来源: https://codeday.me/bug/20191030/1965836.html