本文介绍了使用 LlamaCloud 和 LlamaIndex 进行文档解析,以提取如英国邮政编码、IP 地址、电子邮件地址、银行详细信息等敏感信息的方法,用于欺诈检测和数字取证。通过 GenAI 引擎,可以从各种格式的文档中提取信息,并展示了使用 LlamaExtract 提取信息的代码示例。文章还评估了使用不同配置的成本和输出结果。
本文探讨了在保护用户隐私的前提下改进机器学习应用的方法,重点介绍了同态加密和联邦学习在欺诈检测中的应用。文章讨论了使用同态加密对数据进行加密处理,然后在加密状态下进行机器学习模型训练和推理,以及利用联邦学习在不共享原始数据的情况下,通过多个参与方协作训练模型。