
在使用 yfinance 库进行金融数据分析时,开发者经常会遇到因股票代码无效、已退市或网络连接问题导致的数据获取失败。这些失败有时会表现为 python 异常,有时则仅仅是 yfinance 打印的警告信息,并返回一个空的数据帧。如果不正确处理这些情况,可能会导致后续对有效股票代码的查询也出现问题,从而中断整个数据采集流程。本教程旨在提供一套健壮的策略,确保 yfinance api 在面对各种异常情况时仍能稳定运行。
理解 yfinance 的错误处理机制
yfinance 在处理数据请求时,可能遇到两种主要类型的“失败”:
- 真正的 python 异常: 这通常发生在网络连接失败(如 HTTPSConnectionPool 错误)、dns 解析问题或 API 服务端返回了无法处理的错误时。这类错误会中断程序执行,并需要使用 try-except 语句进行捕获。
- yfinance 内部警告或空数据帧: 对于某些无效、已退市或没有历史数据的股票代码,yfinance 可能不会抛出 Python 异常。相反,它可能会向标准错误输出 (stderr) 打印一条警告信息(例如 “No price data found, symbol may be delisted”),然后返回一个空的 pandas DataFrame,或者一个包含部分数据但带有警告信息的 DataFrame。在这种情况下,try-except 块将不会被触发。
问题的核心在于,即使 yfinance 只是返回一个空数据帧或警告,而不抛出异常,其内部状态也可能受到影响,导致后续对有效股票代码的查询失败。
健壮的数据获取策略
为了确保 yfinance API 在循环或批量获取数据时的稳定性,我们建议采用以下策略:
1. 始终将 history() 的结果赋值给变量
这是解决许多 yfinance 隐性问题的关键一步。即使你可能不立即使用返回的数据,也应该将其赋值给一个变量。这似乎有助于 yfinance 正确地“清理”或管理其内部状态,避免对后续查询产生负面影响。
错误示例(可能导致后续查询失败):
import yfinance as yf # 假设 0250.HK 存在问题,可能导致后续查询受影响 try: yf.Ticker("0250.HK").history(period="max") # 未赋值 except Exception as e: print(f"Error fetching 0250.HK: {e}") # 0001.HK 可能会出现 "No price data found" 警告,即使它是有效的 print(yf.Ticker("0001.HK").history(period="max")) # 未赋值
正确示例(确保后续查询正常):
import yfinance as yf # 即使是问题股票,也赋值 problematic_data = None try: problematic_data = yf.Ticker("0250.HK").history(period="max") except Exception as e: print(f"Error fetching 0250.HK: {e}") # 0001.HK 的查询将正常进行,因为之前的操作被正确处理 valid_data = yf.Ticker("0001.HK").history(period="max") print(valid_data.head()) # 打印数据帧头部
通过上述修改,即使 0250.HK 的查询没有抛出异常(而是返回了数据并打印了警告),将结果赋值给 problematic_data 变量也能确保 0001.HK 的查询不受影响。
2. 捕获真正的 Python 异常
对于网络连接中断等真正的异常,try-except 块是必不可少的。捕获这些异常可以防止程序崩溃,并允许你实现重试逻辑或跳过当前有问题的股票代码。
import yfinance as yf import requests # 用于捕获 HTTPSConnectionPool 相关的异常 tickers = ["0250.HK", "0001.HK", "AAPL"] all_data = {} for ticker_symbol in tickers: print(f"Fetching data for {ticker_symbol}...") try: # 尝试获取数据并赋值 data = yf.Ticker(ticker_symbol).history(period="max") # 检查数据帧是否为空,处理 yfinance 警告的情况 if data.empty: print(f"Warning: No historical data found for {ticker_symbol}. It might be delisted or invalid.") else: all_data[ticker_symbol] = data print(f"Successfully fetched data for {ticker_symbol}.") # print(data.head()) # 可以选择打印部分数据进行验证 except requests.exceptions.ConnectionError as e: print(f"Connection error for {ticker_symbol}: {e}. Skipping this ticker.") except Exception as e: print(f"An unexpected error occurred for {ticker_symbol}: {e}. Skipping this ticker.") print("n--- Summary of fetched data ---") for symbol, df in all_data.items(): print(f"{symbol}: {len(df)} rows of data")
在上述示例中:
- 我们遍历了一个股票代码列表。
- 对于每个股票代码,我们都尝试获取数据并将其赋值给 data 变量。
- try-except 块用于捕获 requests.exceptions.ConnectionError(这是 HTTPSConnectionPool 错误的底层异常类型)以及其他通用异常。
- 在成功获取数据后,我们显式检查 data.empty 属性,以处理 yfinance 返回空数据帧但未抛出异常的情况。
3. 验证数据帧内容
即使 history() 调用成功并返回了一个非空的数据帧,也应检查其内容是否符合预期。例如,检查日期范围、列名或是否存在 NaN 值。
import yfinance as yf ticker_symbol = "AAPL" try: data = yf.Ticker(ticker_symbol).history(period="max") if data.empty: print(f"No data found for {ticker_symbol}.") else: print(f"Data for {ticker_symbol} has {len(data)} rows.") # 进一步验证数据,例如检查最新的日期 if not data.index.empty: print(f"Latest date: {data.index.max().strftime('%Y-%m-%d')}") else: print("Data index is empty.") except Exception as e: print(f"Error fetching {ticker_symbol}: {e}")
总结与注意事项
- 赋值的重要性: 始终将 yf.Ticker(…).history(…) 的结果赋值给一个变量,即使你打算立即丢弃它。这是解决 yfinance 在处理问题股票代码后可能导致后续查询失败的关键。
- 区分异常与警告: try-except 仅捕获 Python 异常。对于 yfinance 打印的警告信息或返回的空数据帧,你需要通过检查 DataFrame.empty 属性来处理。
- 具体的异常捕获: 尽可能捕获更具体的异常类型(如 requests.exceptions.ConnectionError),而不是仅仅使用通用的 except Exception,这样可以编写更精确的错误处理逻辑。
- 循环中的稳健性: 在循环中获取多个股票的数据时,上述策略尤为重要。它能确保一个股票代码的问题不会影响到其他股票代码的数据获取。
- 版本影响: yfinance 库的实现细节可能会随版本更新而变化。本教程基于 yfinance 0.2.33 版本及类似行为。如果遇到持续问题,请检查你的 yfinance 版本并查阅官方文档。
通过遵循这些实践,你可以显著提高使用 yfinance API 进行数据获取的稳定性和可靠性,尤其是在处理大量或不确定质量的股票代码列表时。


