cavis

Author	SHA1	Message	Date
AlexDBlack	a66e03355e	Merge remote-tracking branch 'fork/master'	2019-09-12 12:20:57 +10:00
raver119	07901ceb69	few more mkldnn dependencies removed Signed-off-by: raver119 <raver119@gmail.com>	2019-09-12 04:55:59 +03:00
raver119	98e2814879	Platform helpers (#8216 ) * platform helpers draft Signed-off-by: raver119 <raver119@gmail.com> * typo Signed-off-by: raver119 <raver119@gmail.com> * disable platform cmake Signed-off-by: raver119 <raver119@gmail.com> * another draft Signed-off-by: raver119 <raver119@gmail.com> * mkldnn convolution refactored Signed-off-by: raver119 <raver119@gmail.com> * minor tweaks Signed-off-by: raver119 <raver119@gmail.com> * one more safety check Signed-off-by: raver119 <raver119@gmail.com> * prototype works Signed-off-by: raver119 <raver119@gmail.com> * meh Signed-off-by: raver119 <raver119@gmail.com> * force static library mode for mkldnn Signed-off-by: raver119 <raver119@gmail.com> * - ismax fix - experimental arg fix - don't enforce openblas on Apple hardware Signed-off-by: raver119 <raver119@gmail.com> * bunch of small fixes Signed-off-by: raver119@gmail.com <raver119@gmail.com> * declare concurrent Signed-off-by: raver119@gmail.com <raver119@gmail.com> * - MKLDNN version upgrade to 1.0.2 - avgpool2d/maxpool2d APIs update Signed-off-by: raver119 <raver119@gmail.com> * - avgpool2d_bp/maxpool2d_bp APIs update Signed-off-by: raver119 <raver119@gmail.com> * - conv2d/batchnorm APIs update Signed-off-by: raver119 <raver119@gmail.com> * - lrn/conv2d_bp/conv3d/conv3d_bp APIs update Signed-off-by: raver119 <raver119@gmail.com> * all ops converted to MKLDNN 1.x Signed-off-by: raver119 <raver119@gmail.com> * bunch of tweaks Signed-off-by: raver119 <raver119@gmail.com> * namespace for platform helpers Signed-off-by: raver119 <raver119@gmail.com> * make sure platform helpers aren't opimized out Signed-off-by: raver119 <raver119@gmail.com> * build cpu_features on x86 systems Signed-off-by: raver119 <raver119@gmail.com> * build cpu_features on x86 systems Signed-off-by: raver119 <raver119@gmail.com> * more of cpu_features Signed-off-by: raver119 <raver119@gmail.com> * - mkldnn removed from java - cpu_features checks in CpuNDArrayFactory Signed-off-by: raver119 <raver119@gmail.com> * F16C definition renamed Signed-off-by: raver119 <raver119@gmail.com> * some mkldnn rearrangements Signed-off-by: raver119 <raver119@gmail.com> * check supported instructions before doing anything Signed-off-by: raver119 <raver119@gmail.com> * typo Signed-off-by: raver119 <raver119@gmail.com> * missied impl Signed-off-by: raver119 <raver119@gmail.com> * BUILD_PIC option Signed-off-by: raver119 <raver119@gmail.com> * conv2d fix Signed-off-by: raver119 <raver119@gmail.com> * avgpool3d fix Signed-off-by: raver119 <raver119@gmail.com> * avgpool3d_bp fix Signed-off-by: raver119 <raver119@gmail.com> * avgpool2d_bp leak fix Signed-off-by: raver119 <raver119@gmail.com> * avgpool3d_bp leak fix Signed-off-by: raver119 <raver119@gmail.com> * maxpool bp leaks fixed Signed-off-by: raver119 <raver119@gmail.com> * printf removed Signed-off-by: raver119 <raver119@gmail.com> * batchnorm fix Signed-off-by: raver119 <raver119@gmail.com> * AVX warning/error polishing Signed-off-by: AlexDBlack <blacka101@gmail.com> * Fix Signed-off-by: AlexDBlack <blacka101@gmail.com> * More polish Signed-off-by: AlexDBlack <blacka101@gmail.com> * Polish Signed-off-by: AlexDBlack <blacka101@gmail.com> * remove previous MKL-DNN support layer Signed-off-by: raver119 <raver119@gmail.com> * avx2 tweak Signed-off-by: raver119 <raver119@gmail.com> * allow static for apple Signed-off-by: raver119@gmail.com <raver119@gmail.com> * exclude mkldnn in one more place Signed-off-by: raver119 <raver119@gmail.com> * exclude mkldnn in one more place Signed-off-by: raver119 <raver119@gmail.com> * restore OPENBLAS_PATH use Signed-off-by: raver119 <raver119@gmail.com> * add runtime check for avx/avx2 support Signed-off-by: raver119 <raver119@gmail.com> * convolution_auto Signed-off-by: raver119 <raver119@gmail.com> * Add logic for helper argument * minor test fix Signed-off-by: raver119 <raver119@gmail.com> * few tweaks Signed-off-by: raver119 <raver119@gmail.com> * few tweaks Signed-off-by: raver119 <raver119@gmail.com> * skip OpTracker props for non-x86 builds Signed-off-by: raver119 <raver119@gmail.com> * linux arm isn't x86 :) Signed-off-by: raver119 <raver119@gmail.com> * avx-512 Signed-off-by: raver119 <raver119@gmail.com> * CUDA presets fix Signed-off-by: raver119 <raver119@gmail.com> * BUILD_PIC Signed-off-by: raver119 <raver119@gmail.com> * prefetchw for avx2 Signed-off-by: raver119 <raver119@gmail.com> * BUILD_PIC again Signed-off-by: raver119 <raver119@gmail.com>	2019-09-11 21:50:28 +03:00
shugeo	e1a7460f8e	Shugeo cuda doc2 (#255 ) * Added comments to tileKernel routine. * Refactored kernel and added doc to it. * Refactored setDiagonal kernel and added doc for it. * Added doc for tnse cuda helpers. * Added doc for diag kernels. * Added doc for kernel. * Refactored code with fake quantization. * Added docs for image resize and crop kernels. * Added docs for image suppression helpers. * Added docs to matrix_band helpers. * Added docs for matrix_diag_part and nth_element helpers. * Fixed syntax error and refactored getIndexOffset usage.	2019-09-11 21:04:43 +03:00
raver119	589401477d	[WIP] bunch of improvements (#257 ) * - profiling bias_add op - add some docementation Signed-off-by: Yurii <yurii@skymind.io> * - minor change Signed-off-by: Yurii <yurii@skymind.io> * - provide addBias cuda kernel Signed-off-by: Yurii <yurii@skymind.io> * - improve shape::getIndexOfffset and change its signature Signed-off-by: Yurii <yurii@skymind.io> * - same as previous Signed-off-by: Yurii <yurii@skymind.io> * - improve and change signature in some shape:: stuff which has to do with calculation of offsets for array elements Signed-off-by: Yurii <yurii@skymind.io> * - minor changes in flatten Signed-off-by: Yurii <shyrma@skymind.io> * - add function shape::getIndexOffsetOrdered Signed-off-by: Yurii <shyrma@skymind.io> * - correct shape::getIndexOffsetOrdered() Signed-off-by: Yurii <shyrma@skymind.io> * - move getIndexOffsetOrdered to flatten.h header in order to isolate this function Signed-off-by: Yurii <shyrma@skymind.io>	2019-09-11 20:12:09 +03:00
Alex Black	4f7b35ac82	Update links to eclipse repos (#252 ) * Fix repo links and clean up old github templates Signed-off-by: AlexDBlack <blacka101@gmail.com> * More link updates Signed-off-by: AlexDBlack <blacka101@gmail.com>	2019-09-10 19:09:46 +10:00
raver119	ffae024cda	disable threadlocal for apple Signed-off-by: raver119 <raver119@gmail.com>	2019-09-10 07:46:35 +03:00
shugeo	c9f8a904ad	Shugeo cuda docs1 (#249 ) * Comments axis shifts. * Fixed LUP solver usage. Added helpers doc. * Switch off OMP for roll and lup. Fixed omp usage for ClipByGlobalNorm. * Switch off omp for ClipByGlobalNorm to reduce omp ambigiousness.	2019-09-09 16:27:45 +03:00
raver119	1de9fb218e	- bits_hamming_distance dtype fix (#8208 ) - DataTypeUtils::asString fixe + new dtypes added Signed-off-by: raver119 <raver119@gmail.com>	2019-09-06 08:59:05 +03:00
raver119	46f8c58502	- bits_hamming_distance dtype fix - DataTypeUtils::asString fixe + new dtypes added Signed-off-by: raver119 <raver119@gmail.com>	2019-09-06 08:57:53 +03:00
AlexDBlack	a76a44e198	Merge remote-tracking branch 'fork/master'	2019-09-05 22:04:25 +10:00
raver119	fc222d3325	logging off Signed-off-by: raver119 <raver119@gmail.com>	2019-09-05 14:45:46 +03:00
Yves Quemener	d1e9b34982	libnd4j: Remove some unused declarations in unit tests (#8202 )	2019-09-05 15:04:36 +09:00
Ryan Nett	79867f5c5a	cleanup SDRNN and rnn ops (#238 ) Signed-off-by: Ryan Nett <rnett@skymind.io>	2019-09-05 12:25:03 +10:00
AlexDBlack	b7226bdd7a	Merge Signed-off-by: AlexDBlack <blacka101@gmail.com>	2019-09-05 00:54:11 +10:00
shugeo	548044a1e2	Shugeo doc (#235 ) * Actualized doc to tnse ops. * Added comments for dynamic_stitch op. * Added comments to dynamic_stitch op implementation. * Modified comment for unstack_list op. * Added doc for space_to_depth and depth_to_space ops. * Added doc for space_to_batch op. * Enlarge test type for adjustSaturation. * Added doc for runner.	2019-09-04 14:57:59 +03:00
raver119	a90c7dd995	[WIP] Last set of changes (#234 ) * mmul op instead of cublasSgemm Signed-off-by: raver119 <raver119@gmail.com> * transB Signed-off-by: raver119 <raver119@gmail.com> * jcpp handles Signed-off-by: raver119 <raver119@gmail.com> * bitwise and/or/xor Signed-off-by: raver119 <raver119@gmail.com> * bitwise and/or/xor mapping Signed-off-by: raver119 <raver119@gmail.com> * cuda/cublas version check Signed-off-by: raver119 <raver119@gmail.com> * add expected version Signed-off-by: raver119 <raver119@gmail.com> * cuda/cublas version check in java Signed-off-by: raver119 <raver119@gmail.com> * one more error check Signed-off-by: raver119 <raver119@gmail.com> * build fix Signed-off-by: raver119 <raver119@gmail.com> * build fix Signed-off-by: raver119 <raver119@gmail.com> * build fix Signed-off-by: raver119 <raver119@gmail.com> * one more fix Signed-off-by: raver119 <raver119@gmail.com> * skip CUDA version check for now Signed-off-by: raver119 <raver119@gmail.com> * better wording Signed-off-by: raver119 <raver119@gmail.com> * few more tweaks Signed-off-by: raver119 <raver119@gmail.com> * few more tweaks Signed-off-by: raver119 <raver119@gmail.com>	2019-09-04 14:41:08 +03:00
Alex Black	6cc887bee9	Rename flatbuffers DataType to DType (#228 ) * Rename flatbuffers DataType enum to DType Signed-off-by: Alex Black <blacka101@gmail.com> * Rename flatbuffers DataType enum to DType Signed-off-by: Alex Black <blacka101@gmail.com> * Updates for flatbuffers datatype enum renaming Signed-off-by: Alex Black <blacka101@gmail.com>	2019-09-04 16:36:11 +10:00
raver119	64eaafb4cd	remove unwanted noexcept Signed-off-by: raver119 <raver119@gmail.com>	2019-09-04 08:38:22 +03:00
raver119	7abc574eeb	Snapshot update (#8194 ) * fix double consumption of rng on cpu Signed-off-by: raver119 <raver119@gmail.com> * Shyrma docs (#222) * - documenting and profiling matrix_set_diag cuda kernel Signed-off-by: Yurii <yurii@skymind.io> * - correct formula of pnorm pooling in cuda 2d/3d kernels - remove helper matrix_diag which duplicates work of helper matrix_set_diag Signed-off-by: Yurii <yurii@skymind.io> * cublasHandle sharing + lock Signed-off-by: raver119 <raver119@gmail.com> * cublasHandle sharing + lock Signed-off-by: raver119 <raver119@gmail.com> * Documentation from serialization/deserialization in NLP (#221) * refactoring Signed-off-by: Alexander Stoyakin <alexander.stoyakin@gmail.com> * Javadocs Signed-off-by: Alexander Stoyakin <alexander.stoyakin@gmail.com> * Javadoc fixed Signed-off-by: Alexander Stoyakin <alexander.stoyakin@gmail.com> * Cleanup Signed-off-by: Alexander Stoyakin <alexander.stoyakin@gmail.com> * dedicated lock for getCudaCublasHandle Signed-off-by: raver119 <raver119@gmail.com> * Small fixes (#223) Signed-off-by: AlexDBlack <blacka101@gmail.com> * ELU DL4J fixes (#224) Signed-off-by: AlexDBlack <blacka101@gmail.com> * javadoc (#225) Signed-off-by: Robert Altena <Rob@Ra-ai.com> * Small test compilation fix (#226) Signed-off-by: AlexDBlack <blacka101@gmail.com> * #8182 remove spark version suffix (#227) Signed-off-by: AlexDBlack <blacka101@gmail.com> * [WIP] Thread safety (#229) * sync after cublasgemm Signed-off-by: raver119 <raver119@gmail.com> mutex for CublasHelper Signed-off-by: raver119 <raver119@gmail.com> * don't store cublasHandle in LaunchContext, it's per-device anyway Signed-off-by: raver119 <raver119@gmail.com> * some printout Signed-off-by: raver119 <raver119@gmail.com> * check for field instead Signed-off-by: raver119 <raver119@gmail.com> * pew-pew Signed-off-by: raver119 <raver119@gmail.com> * don't release ContextBuffers until device changed Signed-off-by: raver119 <raver119@gmail.com> * small tweak Signed-off-by: raver119 <raver119@gmail.com> * some logging in sgemm Signed-off-by: raver119 <raver119@gmail.com> * stream sync Signed-off-by: raver119 <raver119@gmail.com> * some more logging Signed-off-by: raver119 <raver119@gmail.com> * some more error checks Signed-off-by: raver119 <raver119@gmail.com> * one fancy test Signed-off-by: raver119 <raver119@gmail.com> * one fancy test Signed-off-by: raver119 <raver119@gmail.com> * minor AffinityManager fix Signed-off-by: raver119 <raver119@gmail.com> * cudaEvent error logging improvement Signed-off-by: raver119 <raver119@gmail.com> * ConstantHelper thread safety Signed-off-by: raver119 <raver119@gmail.com> * - minor corrections in ConstantTadHelper Signed-off-by: Yurii <yurii@skymind.io> * ConstantShapeHelper thread safety Signed-off-by: raver119 <raver119@gmail.com> * ConstantTadHelper.cu updated Signed-off-by: raver119 <raver119@gmail.com> * logging off Signed-off-by: raver119 <raver119@gmail.com> * logging off Signed-off-by: raver119 <raver119@gmail.com>	2019-09-03 22:02:02 +03:00
raver119	dddc8a1143	[WIP] Thread safety (#229 ) * sync after cublasgemm Signed-off-by: raver119 <raver119@gmail.com> mutex for CublasHelper Signed-off-by: raver119 <raver119@gmail.com> * don't store cublasHandle in LaunchContext, it's per-device anyway Signed-off-by: raver119 <raver119@gmail.com> * some printout Signed-off-by: raver119 <raver119@gmail.com> * check for field instead Signed-off-by: raver119 <raver119@gmail.com> * pew-pew Signed-off-by: raver119 <raver119@gmail.com> * don't release ContextBuffers until device changed Signed-off-by: raver119 <raver119@gmail.com> * small tweak Signed-off-by: raver119 <raver119@gmail.com> * some logging in sgemm Signed-off-by: raver119 <raver119@gmail.com> * stream sync Signed-off-by: raver119 <raver119@gmail.com> * some more logging Signed-off-by: raver119 <raver119@gmail.com> * some more error checks Signed-off-by: raver119 <raver119@gmail.com> * one fancy test Signed-off-by: raver119 <raver119@gmail.com> * one fancy test Signed-off-by: raver119 <raver119@gmail.com> * minor AffinityManager fix Signed-off-by: raver119 <raver119@gmail.com> * cudaEvent error logging improvement Signed-off-by: raver119 <raver119@gmail.com> * ConstantHelper thread safety Signed-off-by: raver119 <raver119@gmail.com> * - minor corrections in ConstantTadHelper Signed-off-by: Yurii <yurii@skymind.io> * ConstantShapeHelper thread safety Signed-off-by: raver119 <raver119@gmail.com> * ConstantTadHelper.cu updated Signed-off-by: raver119 <raver119@gmail.com> * logging off Signed-off-by: raver119 <raver119@gmail.com> * logging off Signed-off-by: raver119 <raver119@gmail.com>	2019-09-03 22:00:38 +03:00
raver119	9d03bb9425	allow atomicAdd for CUDA 10 only Signed-off-by: raver119 <raver119@gmail.com>	2019-09-03 13:30:16 +03:00
raver119	f6f9437a36	get back cc 7.0 support for cuda 9.2 Signed-off-by: raver119 <raver119@gmail.com>	2019-09-03 09:26:35 +03:00
Yurii Shyrma	cb4c9377b1	Shyrma docs (#222 ) * - documenting and profiling matrix_set_diag cuda kernel Signed-off-by: Yurii <yurii@skymind.io> * - correct formula of pnorm pooling in cuda 2d/3d kernels - remove helper matrix_diag which duplicates work of helper matrix_set_diag Signed-off-by: Yurii <yurii@skymind.io>	2019-09-02 16:25:58 +03:00
raver119	106524663b	fix double consumption of rng on cpu Signed-off-by: raver119 <raver119@gmail.com>	2019-09-02 15:24:51 +03:00
AlexDBlack	7ded4416cb	Merge remote-tracking branch 'fork/master'	2019-09-02 18:52:12 +10:00
raver119	5b8ea3e830	one more tiny cuda fux Signed-off-by: raver119 <raver119@gmail.com>	2019-09-02 11:49:13 +03:00
raver119	e42c34ca55	[WIP] minor (#218 ) * - initial docs commit - merge* cuda fix Signed-off-by: raver119 <raver119@gmail.com> * one more fix Signed-off-by: raver119 <raver119@gmail.com> * one more fix Signed-off-by: raver119 <raver119@gmail.com>	2019-09-02 11:25:48 +03:00
raver119	c34826da4d	fixed args Signed-off-by: raver119 <raver119@gmail.com>	2019-09-01 22:06:01 +03:00
raver119	00cf28f477	get rid of builtin_popcount to please ppc Signed-off-by: raver119 <raver119@gmail.com>	2019-09-01 19:57:39 +03:00
raver119	3679e55c49	fix bits_hamming_distance for ppc Signed-off-by: raver119 <raver119@gmail.com>	2019-09-01 19:33:23 +03:00
Yurii Shyrma	a35926c6e9	- add parameter alpha to elu and lrelu_bp (#213 ) * - add parameter alpha to elu and lrelu_bp Signed-off-by: Yurii <yurii@skymind.io> * - forgot to correct header activations.h Signed-off-by: Yurii <yurii@skymind.io>	2019-08-31 20:57:39 +03:00
raver119	b71c993ded	[WIP] maxpool_bp cuda fix (#212 ) * one test for alex Signed-off-by: raver119 <raver119@gmail.com> * fix Signed-off-by: raver119 <raver119@gmail.com> * get rid of safety offset in cpp Signed-off-by: raver119 <raver119@gmail.com> * bfloat16 Signed-off-by: raver119 <raver119@gmail.com> * minor test rearrangement to fastpath launch Signed-off-by: raver119 <raver119@gmail.com> * - atomicAdd/Mul/Div fix for float16/bfloat16 misalignment - one special test for maxpoolbp java - safety offset of 8 bytes is back to libnd4j legacy Signed-off-by: raver119 <raver119@gmail.com>	2019-08-31 20:57:05 +03:00
Yurii Shyrma	00fd50cee2	Shyrma softmax (#209 ) * - provide new cuda kernel for softmax Signed-off-by: Yurii <yurii@skymind.io> * - further work on cuda kernel for softmax Signed-off-by: Yurii <yurii@skymind.io> * - correction cuda kernel for softmax Signed-off-by: Yurii <yurii@skymind.io>	2019-08-30 20:31:05 +03:00
raver119	bdc3eacafd	one small playground test Signed-off-by: raver119 <raver119@gmail.com>	2019-08-30 20:13:01 +03:00
raver119	70a9ae5068	[WIP] few tweaks (#206 ) * scatter empty check Signed-off-by: raver119 <raver119@gmail.com> * scatter empty test Signed-off-by: raver119 <raver119@gmail.com> * one more test Signed-off-by: raver119 <raver119@gmail.com> * two tweaks Signed-off-by: raver119 <raver119@gmail.com> * dup tweak Signed-off-by: raver119 <raver119@gmail.com> * - put empty checking of indices array immediately prior helper run Signed-off-by: Yurii <yurii@skymind.io> * minor tests fix Signed-off-by: raver119 <raver119@gmail.com> * minor tests fix Signed-off-by: raver119 <raver119@gmail.com>	2019-08-30 16:32:01 +03:00
raver119	1003428a18	[WIP] Int broadcastables (#195 ) * Removed invalid resource and fixed tests Signed-off-by: Alexander Stoyakin <alexander.stoyakin@gmail.com> * legacy scalar/pairwise/broadcast int ops Signed-off-by: raver119 <raver119@gmail.com> * NDArray int broadcastables Signed-off-by: raver119 <raver119@gmail.com> * few more bitwise tests Signed-off-by: raver119 <raver119@gmail.com> * java side update Signed-off-by: raver119 <raver119@gmail.com> * Argument type changed for shift ops Signed-off-by: Alexander Stoyakin <alexander.stoyakin@gmail.com> * legacy scalar/pairwise/broadcast int ops Signed-off-by: raver119 <raver119@gmail.com> * NDArray int broadcastables Signed-off-by: raver119 <raver119@gmail.com> * few more bitwise tests Signed-off-by: raver119 <raver119@gmail.com> * java side update Signed-off-by: raver119 <raver119@gmail.com> * Argument type changed for shift ops Signed-off-by: Alexander Stoyakin <alexander.stoyakin@gmail.com>	2019-08-30 10:12:40 +03:00
Yurii Shyrma	5395d4fbe5	- rewrite broadcast_dynamic_shape and delete corresponding helpers (#194 ) Signed-off-by: Yurii <yurii@skymind.io>	2019-08-29 20:38:02 +03:00
Yurii Shyrma	70af8c2afc	Shyrma svd (#191 ) * - add one additional test for svd * - provide float argument in eye op to be a type of output array Signed-off-by: Yurii <yurii@skymind.io> * - add cuda capability check to mmulHelper Signed-off-by: Yurii <yurii@skymind.io> * - make use another method for divice id evaluation Signed-off-by: Yurii <yurii@skymind.io> * Eye data type as T argument Signed-off-by: raver119 <raver119@gmail.com>	2019-08-28 18:27:08 +03:00
raver119	dec296da17	[WIP] bits_hamming_distance (#192 ) * bits_hamming_distance op Signed-off-by: raver119 <raver119@gmail.com> * bits_hamming_distance cuda Signed-off-by: raver119 <raver119@gmail.com>	2019-08-28 18:20:44 +03:00
raver119	f4860574d7	[WIP] More fixes (#190 ) * Refactored kernels for segment_max/min/sum ops. * Refactored segment_prod kernels. * Refactored segment_prod kernels. * DynamicPartition test Signed-off-by: raver119 <raver119@gmail.com> * Addede linear test for dynamic_partition op. * Refactored test with int datatype. * some logging Signed-off-by: raver119 <raver119@gmail.com> * some logging Signed-off-by: raver119 <raver119@gmail.com> * some logging Signed-off-by: raver119 <raver119@gmail.com> * dynamicPartition fix Signed-off-by: raver119 <raver119@gmail.com> * get rid of some logging Signed-off-by: raver119 <raver119@gmail.com> * one more test for dynamic_stitch Signed-off-by: raver119 <raver119@gmail.com> * one more test for dynamic_stitch Signed-off-by: raver119 <raver119@gmail.com> * empty check for stitch Signed-off-by: raver119 <raver119@gmail.com> * minor print changes Signed-off-by: raver119 <raver119@gmail.com>	2019-08-28 15:38:57 +03:00
raver119	3157ec110c	[WIP] reverse_sequence (#188 ) * initial commit Signed-off-by: raver119 <raver119@gmail.com> * one more print Signed-off-by: raver119 <raver119@gmail.com> * minor fix Signed-off-by: raver119 <raver119@gmail.com> * reverse_sequence fix Signed-off-by: raver119 <raver119@gmail.com> * confusion_matrix test updated Signed-off-by: raver119 <raver119@gmail.com> * minor tweak Signed-off-by: raver119 <raver119@gmail.com> * minor tweak Signed-off-by: raver119 <raver119@gmail.com> * one more reverse_sequence test Signed-off-by: raver119 <raver119@gmail.com>	2019-08-28 11:14:22 +03:00
raver119	b472d7d8c8	[WIP] few more fixes (#182 ) * one noop test Signed-off-by: raver119 <raver119@gmail.com> * skip input validation for no-input ops Signed-off-by: raver119 <raver119@gmail.com> * - one more noop empty test - one more validation before sync Signed-off-by: raver119 <raver119@gmail.com> * typo Signed-off-by: raver119 <raver119@gmail.com> * one more validation fix Signed-off-by: raver119 <raver119@gmail.com> * CUDA empty reductions java side Signed-off-by: raver119 <raver119@gmail.com> * one svd test Signed-off-by: raver119 <raver119@gmail.com> * Corrected segment_mean helpers and added another test. * Refactored segment_mean kernels to avoid race_condition.	2019-08-27 21:00:38 +03:00
Yurii Shyrma	2144941313	Shyrma fix2 (#186 ) * - further work on layer_norm Signed-off-by: Yurii <yurii@skymind.io> * - further work on layer_norm 2 Signed-off-by: Yurii <yurii@skymind.io> * - correct helpers for svd cuda Signed-off-by: Yurii <yurii@skymind.io>	2019-08-27 19:57:59 +03:00
shugeo	0849b3c1a4	Shugeo segment fix2 (#185 ) * Added test for segment_mean. * Added another test for segment_mean. * Fixed segment_* ops helpers for cuda to proper use external data.	2019-08-27 18:25:39 +03:00
raver119	7f0c660d8b	[WIP] HGemm (#181 ) * skip string arrays for device validation Signed-off-by: raver119 <raver119@gmail.com> * confusion_matrix fix Signed-off-by: raver119 <raver119@gmail.com> * exclude cublasHGemm from archs < 530 Signed-off-by: raver119 <raver119@gmail.com>	2019-08-27 15:05:43 +03:00
raver119	0e523490e9	[WIP] confusion (#180 ) * skip string arrays for device validation Signed-off-by: raver119 <raver119@gmail.com> * confusion_matrix fix Signed-off-by: raver119 <raver119@gmail.com>	2019-08-27 14:30:37 +03:00
raver119	a49f7c908b	[WIP] More fixes (#178 ) * skip string arrays for device validation Signed-off-by: raver119 <raver119@gmail.com> * histogram_fixed_width now really supports indexing types Signed-off-by: raver119 <raver119@gmail.com>	2019-08-27 13:21:01 +03:00
raver119	efbfafe3f7	[WIP] gatherND fix (#176 ) * one test for gather_nd Signed-off-by: raver119 <raver119@gmail.com> * get rid of old concat tests Signed-off-by: raver119 <raver119@gmail.com> * one printf Signed-off-by: raver119 <raver119@gmail.com> * one more legacy test removed Signed-off-by: raver119 <raver119@gmail.com> * gatherNd launch params fix Signed-off-by: raver119 <raver119@gmail.com> * gatherNd launch params fix Signed-off-by: raver119 <raver119@gmail.com>	2019-08-27 12:35:14 +03:00
raver119	df84bc7255	[WIP] More tweaks (#173 ) * CUDA empty reduction Signed-off-by: raver119 <raver119@gmail.com> * - listdiff synchronization fix for CUDA - listdiff test Signed-off-by: raver119 <raver119@gmail.com> * - IndexReduce ops now allow INDEXING_TYPES output - topK op accepts only INDEXING_TYPES as output Signed-off-by: raver119 <raver119@gmail.com>	2019-08-27 10:37:10 +03:00

1 2 3

141 Commits