【代码分析】Tensorflow的session执行分析
# Tensorflow kernal launch 的过程 分析session执行的过程, 并分析Antman对执行过程的修改 函数调用链 Run()-->RunInternel()-->RunAsync()-->ScheduleReady()-->Process() 修改了direct_session.cc , 在session执行前后运行中间件框架 …
像翻阅灵感墙一样浏览我的技术笔记和长期记录。
# Tensorflow kernal launch 的过程 分析session执行的过程, 并分析Antman对执行过程的修改 函数调用链 Run()-->RunInternel()-->RunAsync()-->ScheduleReady()-->Process() 修改了direct_session.cc , 在session执行前后运行中间件框架 …
## Antman对Tensorflow的代码修改 总体的关系图,主要包括两个实现, 内存方面的GPUResourceManagement以及算力方面的GpuOpManager。 ## GPUVMemAllocator GPUVMemAllocator 可以分配host的mem作为显存的备用,以免出现OOM错误。 ### 创建allocator …

# EasyScale 论文阅读笔记 ## Abstract - 分布式同步GPU训练通常被用于深度学习。 - 使用固定GPU的资源约束 - 使得大规模的深度学习训练工作受到影响 - 降低了集群的利用率 - 纳入资源弹性 - 往往会引入模型精度的非确定性<-----缺乏隔离能力 - 本文介绍EasyScale, - 这是一个弹性框架 - 可以在异构GPU上 …

# Gandiva 论文阅读笔记 ## Abstract - Gandiva: 一个集群调度框架,使用特定领域知识,优化了GPU集群训练深度学习模型的延迟与效率 - 深度学习job的特征 - 1)反馈驱动的探索: - 一个用户经常运行一组作业(或 a multi-job)来获得特定任务的最佳结果 - 并使用关于准确性的早期反馈来动态优先考虑或杀死一个作业子 …
# docker 的使用方法 ## docker的安装 docker的版本比较多, 大家可以自行搜索安装方式, 以下只是参考。 ### Ubuntu 安装docker.io比较方便 #### 查询可安装版本 #### 安装docker #### 启动docker #### 重启docker #### 设置开机自启动 #### 验证docker ### …

# 《AntMan: Dynamic Scaling on GPU Clusters for Deep Learning》论文阅读笔记 ## Abstract - 如何在大规模GPU集群上有效调度深度学习工作, 对于**工作性能**,**系统吞吐量**和**硬件利用率**至关重要。 - 随着深度学习的工作量变得更加复杂,它变得越来越具有挑战性。 - 本文将 …

## 《GaiaGPU:Sharing GPUs in Container Clouds》论文笔记 ### Abstract - 对于云服务的提供商, 如何在容器间共享GPU, 是一个有吸引力的问题 - 容器的轻量与伸缩性 - GPU强大的并行计算能力 - 在云环境,容器需要使用一个或多个GPU来满足资源需要的同时, 容器独占式的GPU往往使用率很低 - …

# 在ubuntu上k8s集群部署实践 > centos 上安装建议看 [后端 - CentOS 搭建 K8S,一次性成功,收藏了!_个人文章 - SegmentFault 思否](https://segmentfault.com/a/1190000037682150) ## 一、机器配置 ### 配置主机名 ### 配置/etc/hosts ### 配置 …
## 题目描述 请你来实现一个 myAtoi(string s) 函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C++ 中的 atoi 函数)。 函数 myAtoi(string s) 的算法如下: 1. 读入字符串并丢弃无用的前导空格 2. 检查下一个字符(假设还未到字符末尾)为正还是负号,读取该字符(如果有)。 确定最终结果是负数还是正 …
# 旅行起点 [Go 语言之旅 (go-zh.org)](https://tour.go-zh.org/welcome/1) 上方链接是一个Go语言学习的Playground,快点击它,开启一场Go语言之旅吧 # 旅行开始 ## 练习:循环与函数 为了练习函数与循环,我们来实现一个平方根函数:用牛顿法实现平方根函数。 计算机通常使用循环来计算 x 的平方根 …

# PolarDB Serverless论文阅读报告 ## 摘要 数据库管理系统的上云是近期很火的研究趋势,因为这样可以获得更高的弹性,可用性以及更低的成本,传统的独块的数据库架构很难满足这样的要求。高速网络与新的内存技术(例如RDMA)的发展,给分散式数据库带来了可能:它将原先的独块的服务器资源分离解耦到资源池中,再通过高速网络连接起来。下一代的云原生数 …