Mode | Name | Size | |
---|---|---|---|
-rw-r--r-- | CMakeLists.txt | 3328 | logplain |
-rw-r--r-- | __init__.py | 0 | logplain |
-rw-r--r-- | adagrad.cc | 5424 | logplain |
-rw-r--r-- | adagrad.h | 11683 | logplain |
-rw-r--r-- | adagrad_avx.cc | 3895 | logplain |
-rw-r--r-- | common.h | 3579 | logplain |
-rw-r--r-- | common_avx.cc | 665 | logplain |
-rw-r--r-- | common_avx2.cc | 680 | logplain |
-rw-r--r-- | common_avx512.cc | 974 | logplain |
-rw-r--r-- | cvtsh_ss_bugfix.h | 1922 | logplain |
-rw-r--r-- | embedding_lookup.cc | 16217 | logplain |
-rw-r--r-- | embedding_lookup.h | 1417 | logplain |
-rw-r--r-- | embedding_lookup_avx2.cc | 123521 | logplain |
-rw-r--r-- | embedding_lookup_fused_8bit_rowwise_avx2.cc | 124343 | logplain |
-rw-r--r-- | fused_8bit_rowwise_embedding_lookup.cc | 13783 | logplain |
-rw-r--r-- | fused_8bit_rowwise_embedding_lookup.h | 1689 | logplain |
-rw-r--r-- | hp_emblookup_codegen.py | 16187 | logplain |
-rw-r--r-- | math.h | 1103 | logplain |
-rw-r--r-- | math_cpu_avx2.cc | 7663 | logplain |
-rw-r--r-- | math_cpu_base.cc | 5201 | logplain |
-rw-r--r-- | typed_axpy.cc | 2050 | logplain |
-rw-r--r-- | typed_axpy.h | 355 | logplain |
-rw-r--r-- | typed_axpy_avx.cc | 1247 | logplain |
-rw-r--r-- | typed_axpy_avx2.cc | 2254 | logplain |