todoList java相关工具 jekyll插件 jekyll的配置 jekyll安装 github的个人博客搭建

JVM NMT 工具 k8s学习 docker学习 AQS详解 Raft协议 Ribbon重试问题排查深入理解ClassLoader redis学习 elastic-search学习 reactor学习 eureka学习 tidb文章学习 apache-flink使用 spring-cloud-stream使用 jdk8的ConcurrentHashMap疑惑总结 jstat 监控工具使用说明 effective java 读书笔记 python jupyter 数据分析使用 spring-cloud-sleuth使用 spring-cloud-netflix使用 spring-cloud-confg使用 jupyther notebook 进行数据分析 spring-test使用使用h2在本地跑db单测 spark简介 spring framword 数据访问 YAML简介 YAML简介理解G1垃圾收集器的GC日志 spring boot 使用简介 JDK ThreadGroup简述 JVM 性能监控与故障处理工具 JVM 性能监控与故障处理工具 JVM 垃圾收集器和内存分配策略 JVM内存划分 Spring MessageSource 使用 Spring resources 使用 Spring MessageSource 使用 Spring IoC Container启动过程 Mysql事务隔离级别 Spring Framework各模块简介 Spring IoC Container使用 mysql InnoDB lock 类型使用Jhat分析OOM web安全 SpringMVC文档的疑问 SpringMVC学习 Mysql列转行展示 RMI与RPC JDK版本导致Mybatis在使用时编译不通过 http请求解决跨域问题 Netty权威指南阅读 SqlSessionFactoryBean阅读 top命令 spring中@Cacheable注解使用 SpingMvc的@Responsebody返回值中文乱码问题 SpringIoc学习 guavaCache学习

句子随笔 spring随笔 maven随笔日常开发随笔 Python随笔 Spark随笔 Hive随记常见简称随记面试随笔常见算法 Mac随笔 mysql随笔 linux命令随笔 JVM随笔 git随笔

Collection.sort实现 CPU使用100%问题排查 Java HashMap死循环 Guava Lists.transform()趟坑之旅十万个为什么 Java ThreadLocal类 Java LockSupport类 Java System类 Java Executors类 Executor执行器 Java Map体系学习计划 java集合

策略模式桥接模式适配器模式原型模式建造者模式单例模式 UML图中各种关系的连线设计模式开端简单工厂模式工厂方法模式

jcmd工具使用

数学之美 Java8实战心理学导论-视频笔记大型网站技术架构-读书笔记

模型驱动编程

基础乐理知识

github 2

java相关工具 github的个人博客搭建

jekyll 3

jekyll插件 jekyll的配置 jekyll安装

guava 2

使用Jhat分析OOM guavaCache学习

Spring 5

SpringMVC文档的疑问 SpringMVC学习 spring中@Cacheable注解使用 SpingMvc的@Responsebody返回值中文乱码问题 SpringIoc学习

git 4

面试随笔常见算法 mysql随笔 git随笔

linux 2

linux命令随笔 top命令

mybatis 2

JDK版本导致Mybatis在使用时编译不通过 SqlSessionFactoryBean阅读

netty 1

Netty权威指南阅读

JVM 3

JVM NMT 工具理解G1垃圾收集器的GC日志 JVM随笔

http 1

http请求解决跨域问题

JAVA 1

RMI与RPC

Mysql 2

Mysql事务隔离级别 Mysql列转行展示

web 1

web安全

study 11

CPU使用100%问题排查 Java HashMap死循环 Guava Lists.transform()趟坑之旅十万个为什么 Java ThreadLocal类 Java LockSupport类 Java System类 Java Executors类 Java Map体系学习计划 java集合

javaConcurrent 1

Executor执行器

JDK 1

Collection.sort实现

设计模式 10

策略模式桥接模式适配器模式原型模式建造者模式单例模式 UML图中各种关系的连线设计模式开端简单工厂模式工厂方法模式

java 4

jdk8的ConcurrentHashMap疑惑总结 jstat 监控工具使用说明 effective java 读书笔记 jcmd工具使用

tool 1

jcmd工具使用

mysql 1

mysql InnoDB lock 类型

spring 12

Ribbon重试问题排查 spring随笔 spring-test使用 spark简介 spring framword 数据访问 spring boot 使用简介 Spring MessageSource 使用 Spring resources 使用 Spring MessageSource 使用 Spring IoC Container启动过程 Spring Framework各模块简介 Spring IoC Container使用

mac 1

Mac随笔

jvm 4

JVM 性能监控与故障处理工具 JVM 性能监控与故障处理工具 JVM 垃圾收集器和内存分配策略 JVM内存划分

jdk 1

JDK ThreadGroup简述

yaml 2

YAML简介 YAML简介

unit 1

使用h2在本地跑db单测

test 1

使用h2在本地跑db单测

python 2

python jupyter 数据分析使用 jupyther notebook 进行数据分析

arch 1

大型网站技术架构-读书笔记

spring-cloud 4

spring-cloud-stream使用 spring-cloud-sleuth使用 spring-cloud-netflix使用 spring-cloud-confg使用

maven 1

maven随笔

apache-flink 1

apache-flink使用

tidb 1

tidb文章学习

eureka 1

eureka学习

reactor 1

reactor学习

es 1

elastic-search学习

redis 1

redis学习

stuff 1

心理学导论-视频笔记

Java 2

深入理解ClassLoader Java8实战

音乐 1

基础乐理知识

文字 1

句子随笔

读书 1

数学之美

cloud 1

Ribbon重试问题排查

一致性 1

Raft协议

JDK,并发 1

AQS详解

docker 1

docker学习

k8s 1

k8s学习

jupyther notebook 进行数据分析

2017年10月23日

数据处理demo

    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt

    plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
    plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
    plt.axis('equal') # 设置 饼状图 为圆形，不然可能是椭圆

    df = pd.read_csv("fileName", sep='\t', encoding="gb18030") # 从文件中读取数据，sep为字段间分隔符。ecoding字符集，解决中文乱码问题

    # 使用 send_data 数据集 的 biz_line 加上 call_back_id ，构建出名叫 match_order_no 的列
    # axis=1 表示以 行 为单位处理，默认 axis=0，表示以 列 为单位处理数据
    df['match_order_no'] = df.apply(lambda x : x.biz_line + x.call_back_id, axis=1)

    # 也可以使用外部函数执行：
    from datetime import datetime
    def diff_in_seconds(x):
        diff = datetime.strptime(x.create_time_a,"%Y-%m-%d %H:%M:%S.%f")-datetime.strptime(x.create_time_b,"%Y-%m-%d %H:%M:%S.%f")
        return diff.days*24*3600+diff.seconds

    create_time_data["time_diff"] = create_time_data.apply(diff_in_seconds, axis=1)


    # 单个条件过滤
    fiter_result = df[df.age>10]
    # 多个条件过滤
    fiter_result = df[(df.age>10) & (df.age<25)]

    # 将df1和df2进行关联，类似与 sql 的 join 语法，
    # how 表示 join方式，支持 inner， left，right，outer。默认是 inner
    # left_on 和 right_no 表示使用 df1.match_order_no 等于 df2.order_no 进行记录关联
    # suffixes 表示在两表列名相同的情况下，给 df1 和 df2 的列名加上的后缀
    # 其他参数，参考接口文档：http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.merge.html
    merge_result = pd.merge(df1, df2, how='inner', left_on='match_order_no', right_on='order_no', suffixes=('_a', '_b'))

    # 使用 loc 进行数据截取，1:2 表示截取第一行到第二行的数据(或者可使用 [3,5]表示获取第3行和第5行)，后面的数组表示截取的对应的列名，可使用 : 表示全部获取
    select_result = merge_result.loc[1:2,['biz_order_no','create_time_a','create_time_b','print_type']]

    # 根据 merge_result 中的 time_diff 排序，ascending=False 表示 倒序
    sort_result = merge_result.sort_values('time_diff',ascending=False)