deep-finance : deep-finance深度学习 数据集 任务 描述 股票走势预测 通过推文和历史股价预测股票走势的综合数据集。 股票风险预测 标普500公司的电话会议数据集。 财务句子边界检测 FinSBD-2019数据集包含已自动分段的财务文本,可用于财务句子边界检测。 财务句子边界检测 Financial Phrasebank数据集包含4845个英语句子,这些句子是从LexisNexis数据库中发现的财经新闻中随机选择的。 财务问题解答 财务质量检查数据集是通过在2009年至2017年期间在“投资”主题下抓取Stack交换帖子来构建的。 财务情绪分析 FiQA SA数据集包括两种类型的论述:财经新闻头条和财经微博,以及带有手动注释的目标实体,情感评分和方面。 深度学习在股票市场预测中的应用:最新进展。 arxiv2020。 姜伟伟 个性化的所有人指标:具有股票嵌入功能的
1
介绍在金融工程应用的数值算法和优化技术,有实际的程序代码,是本很好的应用书
2022-08-06 09:04:53 10.91MB Numerical Method Optimization Finance
1
Python SEC 目录 概述 当前版本: 0.1.2 证券交易委员会(SEC)拥有大量免费的商业数据供个人使用。 但是,获得这些免费数据的最大障碍归结为两个挑战: 弄清楚它在哪里 弄清楚如何提取它 Python的SEC库( edgar ),旨在使收集和SEC数据快速,轻松的提取。 该库是围绕以下一些目标设计的: 以实用的方式使EDGAR搜索系统的使用更加直观。 使查询的定义更具可定制性,同时仍保持库的整体清晰度。 标准化返回的内容,以便一致地组织内容,并确保可以动态完成导航到其他目录或文件的方式来填充或扩展数据中的空白。 简化XBRL文件的解析,以便可以更轻松地处理数据。 设置 设置-PyPi安装: 要安装该库,请在终端上运行以下命令。 pip install python-sec 设置-PyPi升级: 要升级该库,请在终端上运行以下命令。 pip install
2022-08-01 09:28:06 26.36MB python finance web-scraper sec
1
深度对冲演示 使用机器学习对衍生产品定价 1) Jupyter version: Run ./colab/deep_hedging_colab.ipynb on Colab. 2) Gui version: Run python ./pyqt5/main.py Check ./requirements.txt for main dependencies. Black-Scholes(BS)模型-于1973年开发,并基于获得诺贝尔奖的作品-在近半个世纪以来一直是定价选择和其他金融衍生品的事实上的标准。 在理想的金融市场的假设下,可以使用该模型来计算期权价格和相关的风险敏感性。 然后,交易者可以从理论上使用这些风险敏感性来创建完善的对冲策略,以消除期权组合中的所有风险。 但是,在现实世界中很难满足完美金融市场的必要条件,例如零交易成本和连续交易的可能性。 因此,在实践中,银行必须依靠其交
1
3.4 领域情感词典的构建 (1) 确定种子词集合。根据所选领域的特点, 制定 相应的选择标准, 抽取语料库中的词语作为种子词, 加入到种子词集合中; (2) 确定候选情感词集合。首先将种子词转换成 对应的词向量, 根据相似度计算公式(向量的余弦计算 公式)求得与每个种子词最相似的n个词语作为候选情 感词集合; (3) 利用训练好的情感分类器判断每个候选词的 情感极性。最后整合上述分类器输出的带有情感极性 的候选词语, 添加到面向特定领域的情感词典中。 4 实验及结果分析 为了验证该方法的有效性, 本文设计实验进行验 证, 主要验证以下两点假设: 假设 1: 本文提出以词向量训练分类器判断词语 情感极性的方法优于直接利用词向量的语义相似度判 断词语情感极性。 在情感分析领域, 大部分常规机器学习方法, 如 决策树、支持向量机等, 都能够构建分类器来判断词 语的情感极性。由于自然语言的特殊性(直接特征不足, 需要转换成词向量进行分析, 特征数即为词向量的维 度), 使得支持向量机的表现优于其他机器学习算法。 假设 2: 深度学习中, 神经网络训练的分类器在 判断词语情感极性任务中的性能优于支持向量机 (SVM)训练的分类器。 4.1 实验 1: 构建基于词向量的神经网络分类器 实验使用的语义知识库包括 NTUSD; 清华大学 李军情感词典; HowNet情感词典中的正负情感词语以 及 DUTIR。语料库的获取主要借助 Python 所编写的 爬虫程序, 采集 2017 年 4 月 19 日–2017 年 10 月 9 日 的新浪财经新闻, 共计 9 422 篇, 每篇新闻均以 txt 的 形式进行存储。 对语料库进行数据预处理(去停用词、去无关符 号)与分词(构建自定义词典: 将所有股票名称和股票 代码作为一个词典, 防止分词时被切分)。抽取融合词 典与语料库的交集词汇作为训练语料, 结果如表 2 所 示。最后以语料库为对象, 使用 Word2Vec 方法生成词 向量模型, 其中每个词向量的维度为 100。 表 2 词典中的词出现在语料库中的情况表 交集的积极词数量 交集的消极词数量 总计 3 128 2 850 5 978 基于准备好的训练语料, 按照实验设计方案构建 神经网络分类器。经过 6 700 次训练后, 得到训练集准 确度为 95.02%, 预测集准确度为 95.00%。显然, 模型 的效果良好, 并没有出现过拟合和欠拟合的现象。 接着确定种子词集合。由于本文重点不在于研究 种子词抽取规则, 因此不作深入探讨。通过信息检索, 参考相关论文及结合本文语料库, 选择 20个能够代表 金融领域的词汇作为种子词集合, 如表 3 所示。 表 3 金融领域种子词集合 金融领域种子词集合 大涨, 大跌, 股票, 平仓, 牛市, 熊市, 走高, 拉升, 雄起, 利好, 利空, 清仓, 套牢, 抄底, 反弹, 减持, 乏力, 退市, 撤离, 亏 词向量最大的特点是将语义信息用向量的形式进 行分布式表示。词向量之间的余弦值能够表示词语之 间的相关性程度。通常直接利用词向量构建情感词典 的方式为: 判断种子词的情感极性, 利用词向量找出 与种子词最相似的词语集合, 与积极种子词相似的词 语被认为是积极情感词, 与消极种子词相似的词语被 认为是消极情感词, 从而构建情感词典。本文对上述 种子词集合中的种子词的情感极性进行人工判断, 找 出与每个种子词最相似的词语(取相似度最高的前 10 个词语)。对金融语料的研究发现, 绝大部分金融领域 的情感词词性为形容词或者动词, 因此在取相似度最 高的词语的过程中加入词性过滤, 仅选择形容词和动 词, 最后对积极和消极的词语分别去重, 得到情感词 典(消极词语 61 个, 积极词语 41 个)。 笔者认为仅根据词向量的相似度判断词语情感极 性的判断并不准确。因为词向量仅仅保留语义信息, 而语义信息并不能代表情感信息, 存在情感极性相反 的词语在语义关系比较相似, 如“跌”显然表示消极情
2022-07-08 16:57:41 594KB Finance
1
互联网金融Internet-Finance.ppt该文档详细且完整,值得借鉴下载使用,欢迎下载使用,有问题可以第一时间联系作者~
2022-07-05 18:04:23 1.49MB 文档资料
py_vollib_vectorized 介绍 py_vollib_vectorized程序包使数以千计的期权合约定价和快速轻松地计算希腊文。 它建立在py_vollib库的顶部。 导入后,它将自动修补相应的py_vollib函数,以支持矢量化。 输入然后可以作为浮点数,元组,列表, numpy.array或pandas.Series 。 在输入上执行自动广播。 除了矢量化之外,对py_vollib的修改还包括其他numba加速。 因此, numba是必需的。 这些加速使py_vollib_vectorized成为定价期权合约最快的库。 有关更多详细信息,请参见。 安装 pip install py_vollib_vectorized 要求 适用于Python 3.5+ 需要py_vollib,numba,numpy,pandas,scipy 代码样本 该库可以以两种方式使用。 导入
2022-06-22 09:23:50 93KB finance trading trading-bot pandas
1
塞德加 一次获得各种公司的文件确实很痛苦,但是SEC-Edgar会为您做到这一点。 您可以使用一个命令从EDGAR数据库下载公司的所有定期报告,文件和表格。 安装 您可能需要使用pip安装软件包: $ pip install secedgar 或者 您可以克隆项目或将其下载为zip。 $ git clone https://github.com/sec-edgar/sec-edgar.git $ cd sec-edgar $ python setup.py install 跑步 from secedgar . filings import Filing , FilingType # 10Q filings for Apple (ticker "aapl") my_filings = Filing ( cik_lookup = 'aapl' , filing_type = Filing
2022-06-11 16:18:01 1.13MB python finance sec edgar
1
gosling-sc-finance-source 投资管理项目,采用太阳线+小公排制度,项目分会员平台+管理后台,采用主流SSM技术开发,开源代码,供学习研究。 采用MAVEN多模块重建 gosling-sc-finance-parent父模块 gosling-base-core核心模块:工具类,异常类,反向封装类 gosling-base-dao数据库交互:CURD gosling-sc-finance-controller控制器+业务逻辑 依赖关系 Gosling-SC-财务控制器<--- Gosling-Base-dao gosling-sc-finance-controller <--- ggosling-base-core
2022-06-09 13:25:34 9.22MB 系统开源
1
This book will cover the broad topic of automated trading , starting with mathematics and moving to computation and execution. You will gain unique insight into the mechanics and computational considerations taken in building a backtester, strategy optimizer, and fully functional trading platform. The code examples in this text are derived from deliverables of real consulting and software development contracts. At the end of the book, we will bring the concepts together and build an automated trading platform from scratch. This book will give a prospective algorithm trader everything he needs except a trading account, including full source code.
2022-06-04 01:06:26 6.24MB R-Language finance quant
1