cryptoservice.data.storage_db
cryptoservice.data.storage_db
Classes
DatabaseConnectionPool(db_path: Path | str, max_connections: int = 5)
线程安全的数据库连接池实现
初始化连接池
PARAMETER | DESCRIPTION |
---|---|
db_path
|
数据库文件路径
TYPE:
|
max_connections
|
每个线程的最大连接数
TYPE:
|
Source code in src/cryptoservice/data/storage_db.py
Functions
get_connection() -> Generator[sqlite3.Connection, None, None]
获取当前线程的数据库连接
Source code in src/cryptoservice/data/storage_db.py
MarketDB(db_path: Path | str, use_pool: bool = False, max_connections: int = 5)
市场数据库管理类,专注于存储和读取交易对数据.
初始化 MarketDB.
PARAMETER | DESCRIPTION |
---|---|
db_path
|
数据库文件路径
TYPE:
|
use_pool
|
是否使用连接池
TYPE:
|
max_connections
|
连接池最大连接数
TYPE:
|
Source code in src/cryptoservice/data/storage_db.py
Functions
store_data(data: list[PerpetualMarketTicker] | list[list[PerpetualMarketTicker]], freq: Freq) -> None
存储市场数据.
PARAMETER | DESCRIPTION |
---|---|
data
|
市场数据列表,可以是单层列表或嵌套列表
TYPE:
|
freq
|
数据频率
TYPE:
|
Source code in src/cryptoservice/data/storage_db.py
131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 |
|
read_data(start_time: str, end_time: str, freq: Freq, symbols: list[str], features: list[str] | None = None, raise_on_empty: bool = True) -> pd.DataFrame
读取市场数据.
PARAMETER | DESCRIPTION |
---|---|
start_time
|
开始时间 (YYYY-MM-DD)
TYPE:
|
end_time
|
结束时间 (YYYY-MM-DD)
TYPE:
|
freq
|
数据频率
TYPE:
|
symbols
|
交易对列表
TYPE:
|
features
|
需要读取的特征列表,None表示读取所有特征
TYPE:
|
raise_on_empty
|
当没有数据时是否抛出异常,False则返回空DataFrame
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
DataFrame
|
pd.DataFrame: 市场数据,多级索引 (symbol, timestamp) |
Source code in src/cryptoservice/data/storage_db.py
read_data_by_timestamp(start_ts: int | str, end_ts: int | str, freq: Freq, symbols: list[str], features: list[str] | None = None, raise_on_empty: bool = True) -> pd.DataFrame
使用时间戳读取市场数据.
PARAMETER | DESCRIPTION |
---|---|
start_ts
|
开始时间戳 (毫秒,int或str)
TYPE:
|
end_ts
|
结束时间戳 (毫秒,int或str)
TYPE:
|
freq
|
数据频率
TYPE:
|
symbols
|
交易对列表
TYPE:
|
features
|
需要读取的特征列表,None表示读取所有特征
TYPE:
|
raise_on_empty
|
当没有数据时是否抛出异常,False则返回空DataFrame
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
DataFrame
|
pd.DataFrame: 市场数据,多级索引 (symbol, timestamp) |
Source code in src/cryptoservice/data/storage_db.py
get_available_dates(symbol: str, freq: Freq) -> list[str]
获取指定交易对的可用日期列表.
PARAMETER | DESCRIPTION |
---|---|
symbol
|
交易对
TYPE:
|
freq
|
数据频率
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
list[str]
|
List[str]: 可用日期列表 (YYYY-MM-DD格式) |
Source code in src/cryptoservice/data/storage_db.py
export_to_files_by_timestamp(output_path: Path | str, start_ts: int | str, end_ts: int | str, freq: Freq, symbols: list[str], target_freq: Freq | None = None, chunk_days: int = 30) -> None
使用时间戳将数据库数据导出为npy文件格式,支持降采样.
PARAMETER | DESCRIPTION |
---|---|
output_path
|
输出目录
TYPE:
|
start_ts
|
开始时间戳 (毫秒,int或str)
TYPE:
|
end_ts
|
结束时间戳 (毫秒,int或str)
TYPE:
|
freq
|
原始数据频率
TYPE:
|
symbols
|
交易对列表
TYPE:
|
target_freq
|
目标频率,None表示不进行降采样
TYPE:
|
chunk_days
|
每次处理的天数,用于控制内存使用
TYPE:
|
Source code in src/cryptoservice/data/storage_db.py
401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 |
|
export_to_files(output_path: Path | str, start_date: str, end_date: str, freq: Freq, symbols: list[str], target_freq: Freq | None = None, chunk_days: int = 30) -> None
将数据库数据导出为npy文件格式,支持降采样.
PARAMETER | DESCRIPTION |
---|---|
output_path
|
输出目录
TYPE:
|
start_date
|
开始日期 (YYYY-MM-DD)
TYPE:
|
end_date
|
结束日期 (YYYY-MM-DD)
TYPE:
|
freq
|
原始数据频率
TYPE:
|
symbols
|
交易对列表
TYPE:
|
target_freq
|
目标频率,None表示不进行降采样
TYPE:
|
chunk_days
|
每次处理的天数,用于控制内存使用
TYPE:
|
Source code in src/cryptoservice/data/storage_db.py
545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 |
|
visualize_data(symbol: str, start_time: str, end_time: str, freq: Freq, max_rows: int = 20) -> None
可视化显示数据库中的数据.
PARAMETER | DESCRIPTION |
---|---|
symbol
|
交易对
TYPE:
|
start_time
|
开始时间 (YYYY-MM-DD)
TYPE:
|
end_time
|
结束时间 (YYYY-MM-DD)
TYPE:
|
freq
|
数据频率
TYPE:
|
max_rows
|
最大显示行数
TYPE:
|
Source code in src/cryptoservice/data/storage_db.py
is_date_matching(ts: Any, target_date: datetime.date) -> bool
process_dataframe_by_date(df: pd.DataFrame, date: datetime.date, feature_processor: Callable[[pd.DataFrame, str], None]) -> None
按日期处理数据框并应用特征处理函数