Soren v Solari, Big Sky, MT,美国开发商
Soren is available for hire
Hire Soren

Soren v Solari

Verified Expert  in Engineering

Algorithm Developer

Location
Big Sky, MT, United States
Toptal Member Since
March 4, 2019

Soren is a master of many skillsets. With a Ph.D. in integrative neuroscience, 他提供的算法专利如今被雀巢(nestle)和日产(Nissan)等公司使用, 在c级做业务开发销售, and built scalable AWS systems. Soren has written real-time back ends, React front ends, cognitive systems, 以及从零开始的基因组数据挖掘算法. 索伦是一位杰出的系统思想家,他能通过罕见的沟通组合解决任何问题, architecture, and code.

Portfolio

Simpa
医疗保健、亚马逊网络服务(AWS)、微服务、React、Python...
Voiceops
算法,Python 3,深度学习,语音到文本,翻译,PyTorch...
Oregon Health & Science University
Python,数据科学,机器学习,自然语言处理(NLP), GPT...

Experience

Availability

Part-time

Preferred Environment

亚马逊网络服务(AWS), Gmail, Linux, MacOS, Slack, GitHub, WebStorm, PyCharm, React, Python

The most amazing...

...我开发的产品是一个个性化的健康应用, 在可扩展的AWS中编写100%的Python后端, 100% of the React front end, models, and everything.

Work Experience

CTO

2015 - PRESENT
Simpa
  • 发明并建立了一个革命性的个性化健康应用程序,结合了医疗记录, nutrition, activity, and arbitrary data for users.
  • 为个性化健康开发了复杂的新型医疗保健预测模型, 包括食谱和活动建议以及血液分析. 该模型有助于对公共营养数据的世界级理解.
  • 在React中构建一个完整的前端,使用现代的方法,只使用功能性组件,利用React钩子,包括高吞吐量的websockets和后端API集成.
  • Deployed and managed dozens of different microservices; worked with a scalable API, websockets, DNS, and more.
  • 使用ZeroMQ为RPC通信编写核心Python微服务框架的每一行, discovery services, load balancing, logging, monitoring, tracing, 以及持续的CDI测试/部署到AWS基础设施.
  • 以自动化的方式在基于云的基础设施上处理微服务和部署.
  • 开发了个人健康记录的网络抓取技术,以及从在线资源中抓取配方信息.
  • 从零开始构建一个PDF阅读器模型,从二进制PDF输入开始从PDF中提取信息(完全没有第三方工具).
  • 围绕自然语言处理开发其他核心技术, artificial intelligence, machine learning, 以及以复杂的方式集成复杂数据的多个其他概念.
  • 从头开始创建了一个聊天机器人,没有任何具有交互式对话功能的第三方工具, conversation tracking over time, 以及通过短信和web应用聊天机器人(通过websockets)同时/可互换的交互性.
Technologies: 医疗保健、亚马逊网络服务(AWS)、微服务、React、Python, 生成预训练变压器(GPT), Natural Language Processing (NLP), GPT, Azure Machine Learning, Artificial Intelligence (AI)

机器学习|团队领导和架构师

2021 - 2022
Voiceops
  • 领导一个小团队重新设计和开发一个新的机器学习基础设施,以处理接近实时的呼叫中心转录应用程序的多个机器学习服务.
  • 率先开发新的文本到文本“翻译”深度学习模型,以更有效地生成干净的成绩单, 利用数以百万计的通话记录.
  • 为呼叫中心创新了一种新的深度学习语义相似度搜索,以基于语义在转录呼叫中找到感兴趣的位置. 用户可以写下句子或短语,并找到所有相似的位置.
  • 协助业务开发一套额外的ML跟踪指标,以便可以测量模型性能、业务性能和归因, including stakeholder management.
  • 将ML服务作为api与现有管道和并行工程团队的应用程序流集成.
Technologies: 算法,Python 3,深度学习,语音到文本,翻译,PyTorch, Hugging Face

Data Scientist

2020 - 2021
Oregon Health & Science University
  • 在大量文本数据上开发NLP模型和新的数据转换管道(用于NLP预测建模),为一种罕见疾病(淀粉样变性)创建预测模型。.
  • 在HIPAA设置中开发远程数据管道,以处理大量医疗保健数据(来自约12个不同的患者表).
  • 创建了新的数据处理方法,在患者的任意文本数据(来自不同来源)上运行,以便为未诊断的患者提供最高的预测能力.
  • 创建了NLP预测模型,用于在医疗数据的转换向量空间上预测现实世界的患者.
Technologies: Python,数据科学,机器学习,自然语言处理(NLP), GPT, 生成预训练变压器(GPT), Healthcare, Predictive Modeling

Database DevOps Creator for Time-series

2020 - 2021
Pantera Capital
  • 了解客户在时间序列上的需求,并提出问题陈述. 研究了所有可用的时间序列数据库,并推荐了解决方案和体系结构.
  • Designed a Redshift database architecture to have the fastest possible access times (<500 ms) for arbitrary time-series data. Data is basically arbitrarily scalable.
  • 设计了一个能够处理分钟级实时时间序列的数据库,用于交易加密货币的预测模型.
  • 编写了所有Python代码并开发了一个自定义Python包来作为并发连接访问数据库以提高吞吐量.
  • 将所有维护数据的应用程序进行dockerization,并将其部署到AWS Fargate. 创建了单行部署,以简化正在进行的改进.
  • 通过AWS Fargate(自动扩展)创建面向公众的API,允许对数据库进行读/写/删除访问,该数据库被配置为向提供API密钥的单个时间序列授予权限. 这允许客户端对其他人进行有限的访问.
Technologies: Python, Redshift, ETL, Cryptocurrency, APIs, Amazon Web Services (AWS), AWS Fargate, Containers, Docker

Senior Lead Analytics

2019 - 2020
Ensemble Health Partners
  • 领导一个小型机器学习团队,为一家大型医疗保健公司开发新的分析方法,以创新新的算法和产品,同时与公司的利益相关者进行沟通.
  • 为应用于大型医院外包公司的预测模型开发了新颖的算法和计算基础设施,结果为0美元.1–$1.每家医院每月收入提升500万(适用于数十家医院).
  • 开发了一种新的算法来预测与ICD-10相关的错误住院记录和诊断相关的分组编码,以确保最大的盈利能力. 该算法已在数十家医院集团中部署并发挥作用.
  • 开发了一种新的算法,用于检测门诊医院就诊中遗漏的费用. 发明了与关联规则和k近邻相关的新算法,以提高性能.
  • 建立计算基础设施,以便为数十个医疗保健客户快速构建和部署预测模型. 现在,数十名工程师使用该基础设施将模型快速部署到所有客户端.
  • 开发了一个住院DRG编码器(从零开始)来增强预测模型. 需要了解住院医院账单的最内部工作原理.
  • 撰写专利并领导几个开发人员改进Azure上现有的基础设施.
Technologies: Healthcare, Azure, SQL, Python, Natural Language Processing (NLP), GPT, 生成预训练变压器(GPT), Azure Machine Learning, Artificial Intelligence (AI)

Analytics Contractor

2019 - 2019
Department of Defense Subcontractor
  • 用TensorFlow构建并训练了一个唇读深度神经网络来预测数字, letters, and words that were spoken by readers.
  • 定位和清理用于唇读的多个训练数据集.
  • 在AWS EC2基础架构上配置和设置GPU训练管道.
  • 修改深度神经网络结构和数据管道,以优化实际问题,而不是客户最初提出的学术问题.
  • 达到客户要求的85%精度要求.
技术:亚马逊网络服务(AWS)、GPU计算、Python 3、Python、TensorFlow

分析和解决方案架构师主管

2013 - 2015
Nestlé Institute of Health Sciences
  • 在一个全新的R领导六到八人的软件和机器学习开发团队&D研究所将结合来自不同研究实验室的六个数据输出,推动对大规模生物信息学数据的最先进分析.
  • 在雀巢雀巢与三星合作的基础上,发明并开发了新的营养分析方法. 建立了一个营养推荐引擎,主要在雀巢雀巢内部使用.
  • 为某大型研究机构开发和设计核心分析基础设施, leading a team to implement it.
  • 开发整合基因组学的生物信息学模型, proteomics, metabolomics, 临床数据)为数百万美元的临床研究.
技术:生成预训练变压器(GPT), GPT, Natural Language Processing (NLP), Azure Machine Learning, Artificial Intelligence (AI), SQL, Microservices, Python

CTO | CEO

2011 - 2013
Simigence
  • 为建立基于神经解剖学的系统(计算机中的大脑)以及相关基础设施做出了贡献.
  • 创造了第一个关于模拟智能和基于神经解剖学的系统的专利.
  • 建立全尺寸的大脑模拟,这是今天使用的许多神经网络架构的前身.
  • 为IARPA在华盛顿的早期投资赢得了支持.
Technologies: Deep Learning, Computer Vision, 生成预训练变压器(GPT), GPT, Natural Language Processing (NLP), Azure Machine Learning, Artificial Intelligence (AI), React, Python

Senior Analytics Manager

2009 - 2013
Opera Solutions
  • Designed custom models (linear and non-linear) for multiple Fortune 1000 companies; this involved rewards recommendations, 医疗医院访问收入预测, vehicle auction models, and more.
  • 提出了一种将卡尔曼滤波与K-NN相结合的广义预测自适应非线性模型, 然后构建模型并将其部署到生产环境中. 它需要几乎为零的维护和连续的一流预测.
  • 作为解决方案架构师,理解和制定问题,并在初始数据上快速开发原型.
Technologies: Python

Cognitive Consilience

http://www.frontiersin.org/files/cognitiveconsilience/index.html
Based on my PhD research, 我开发了灵长类大脑中最全面的神经解剖学连接蓝图,并提出了一个关于大脑中所有主要结构功能的假设.

这可能是第一个与交互式web应用程序同时发布的科学出版物, iPhone, and iPad app.

一个解决相当困难的问题的例子:“大脑是如何工作的??"

Languages

Python, Python 3, SQL, C

Paradigms

微服务,数据科学,微服务架构,并行编程,ETL

Other

Artificial General Intelligence (AGI), Predictive Modeling, Machine Learning, Algorithms, Artificial Intelligence (AI), Analytics, Big Data, Natural Language Processing (NLP), Deep Learning, Computer Vision, Build Pipelines, Electronic Medical Records (EMR), Time Series, Mobile First, MobX-State-Tree (MST), Containers, Container Orchestration, OCR, APIs, Speech to Text, Translation, Containerization, GPT, 生成预训练变压器(GPT), Gmail, GPU Computing, HL7, Electrical Engineering, Cryptocurrency, Hugging Face, Neuroscience

Frameworks

WebApp

Libraries/APIs

React, MobX, Amazon rekrecognition, NumPy, TensorFlow, Python Asyncio, PyTorch

Tools

GitHub, AWS Fargate, Amazon弹性容器服务(Amazon ECS), PyCharm, WebStorm, Slack, Azure Machine Learning

Platforms

Docker、Amazon EC2、MacOS、Linux、Amazon Web Services (AWS)、Azure、Kubernetes

Storage

Data Pipelines, Redshift

Industry Expertise

Healthcare

2005 - 2009

PhD in Integrative Neuroscience

UCSD |加州大学圣地亚哥分校-美国加州圣地亚哥

2002 - 2005

Master's Degree in Control Theory

UCSD |加州大学圣地亚哥分校-美国加州圣地亚哥

1995 - 1999

电气工程双学士学位(BSc/BA)

圣地亚哥大学-圣地亚哥,加州,美国