update model card README.md

1ea6a43 over 3 years ago

5.67 kB

	---
	tags:
	- generated_from_trainer
	model-index:
	- name: output_diff_approach
	results: []
	---

	<!-- This model card has been generated automatically according to the information the Trainer had access to. You
	should probably proofread and complete it, then remove this comment. -->

	# output_diff_approach

	This model is a fine-tuned version of [csebuetnlp/banglabert](https://huggingface.co/csebuetnlp/banglabert) on an unknown dataset.
	It achieves the following results on the evaluation set:
	- Loss: 0.1603
	- 5 Err Precision: 0.0
	- 5 Err Recall: 0.0
	- 5 Err F1: 0.0
	- 5 Err Number: 34
	- Precision: 0.4328
	- Recall: 0.3244
	- F1: 0.3709
	- Number: 9934
	- Err Precision: 0.0
	- Err Recall: 0.0
	- Err F1: 0.0
	- Err Number: 285
	- Egin Err Precision: 0.7528
	- Egin Err Recall: 0.4192
	- Egin Err F1: 0.5385
	- Egin Err Number: 1126
	- El Err Precision: 0.7112
	- El Err Recall: 0.2891
	- El Err F1: 0.4111
	- El Err Number: 1380
	- Nd Err Precision: 0.6986
	- Nd Err Recall: 0.4487
	- Nd Err F1: 0.5464
	- Nd Err Number: 1188
	- Ne Word Err Precision: 0.7223
	- Ne Word Err Recall: 0.6297
	- Ne Word Err F1: 0.6728
	- Ne Word Err Number: 8247
	- Unc Insert Err Precision: 0.6140
	- Unc Insert Err Recall: 0.0776
	- Unc Insert Err F1: 0.1378
	- Unc Insert Err Number: 902
	- Micro Avg Precision: 0.5922
	- Micro Avg Recall: 0.4282
	- Micro Avg F1: 0.4970
	- Micro Avg Number: 23096
	- Macro Avg Precision: 0.4915
	- Macro Avg Recall: 0.2736
	- Macro Avg F1: 0.3347
	- Macro Avg Number: 23096
	- Weighted Avg Precision: 0.5832
	- Weighted Avg Recall: 0.4282
	- Weighted Avg F1: 0.4841
	- Weighted Avg Number: 23096
	- Overall Accuracy: 0.9514

	## Model description

	More information needed

	## Intended uses & limitations

	More information needed

	## Training and evaluation data

	More information needed

	## Training procedure

	### Training hyperparameters

	The following hyperparameters were used during training:
	- learning_rate: 2e-05
	- train_batch_size: 16
	- eval_batch_size: 16
	- seed: 42
	- gradient_accumulation_steps: 2
	- total_train_batch_size: 32
	- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
	- lr_scheduler_type: linear
	- lr_scheduler_warmup_ratio: 0.1
	- num_epochs: 2.0

	### Training results

	\| Training Loss \| Epoch \| Step \| Validation Loss \| 5 Err Precision \| 5 Err Recall \| 5 Err F1 \| 5 Err Number \| Precision \| Recall \| F1 \| Number \| Err Precision \| Err Recall \| Err F1 \| Err Number \| Egin Err Precision \| Egin Err Recall \| Egin Err F1 \| Egin Err Number \| El Err Precision \| El Err Recall \| El Err F1 \| El Err Number \| Nd Err Precision \| Nd Err Recall \| Nd Err F1 \| Nd Err Number \| Ne Word Err Precision \| Ne Word Err Recall \| Ne Word Err F1 \| Ne Word Err Number \| Unc Insert Err Precision \| Unc Insert Err Recall \| Unc Insert Err F1 \| Unc Insert Err Number \| Micro Avg Precision \| Micro Avg Recall \| Micro Avg F1 \| Micro Avg Number \| Macro Avg Precision \| Macro Avg Recall \| Macro Avg F1 \| Macro Avg Number \| Weighted Avg Precision \| Weighted Avg Recall \| Weighted Avg F1 \| Weighted Avg Number \| Overall Accuracy \|
	\|:-------------:\|:-----:\|:----:\|:---------------:\|:---------------:\|:------------:\|:--------:\|:------------:\|:-----------:\|:--------:\|:------:\|:--------:\|:--------------:\|:-----------:\|:-------:\|:-----------:\|:------------------:\|:---------------:\|:-----------:\|:---------------:\|:----------------:\|:-------------:\|:---------:\|:-------------:\|:----------------:\|:-------------:\|:---------:\|:-------------:\|:---------------------:\|:------------------:\|:--------------:\|:------------------:\|:------------------------:\|:---------------------:\|:-----------------:\|:---------------------:\|:-------------------:\|:----------------:\|:------------:\|:----------------:\|:-------------------:\|:----------------:\|:------------:\|:----------------:\|:----------------------:\|:-------------------:\|:---------------:\|:-------------------:\|:----------------:\|
	\| 0.3987 \| 1.0 \| 575 \| 0.1930 \| 0.0 \| 0.0 \| 0.0 \| 34 \| 0.3517 \| 0.1737 \| 0.2326 \| 9934 \| 0.0 \| 0.0 \| 0.0 \| 285 \| 0.8127 \| 0.2389 \| 0.3693 \| 1126 \| 0.8345 \| 0.1681 \| 0.2799 \| 1380 \| 0.6727 \| 0.3460 \| 0.4569 \| 1188 \| 0.7470 \| 0.4215 \| 0.5389 \| 8247 \| 0.25 \| 0.0011 \| 0.0022 \| 902 \| 0.5670 \| 0.2648 \| 0.3610 \| 23096 \| 0.4586 \| 0.1687 \| 0.2350 \| 23096 \| 0.5519 \| 0.2648 \| 0.3508 \| 23096 \| 0.9422 \|
	\| 0.1861 \| 2.0 \| 1150 \| 0.1603 \| 0.0 \| 0.0 \| 0.0 \| 34 \| 0.4328 \| 0.3244 \| 0.3709 \| 9934 \| 0.0 \| 0.0 \| 0.0 \| 285 \| 0.7528 \| 0.4192 \| 0.5385 \| 1126 \| 0.7112 \| 0.2891 \| 0.4111 \| 1380 \| 0.6986 \| 0.4487 \| 0.5464 \| 1188 \| 0.7223 \| 0.6297 \| 0.6728 \| 8247 \| 0.6140 \| 0.0776 \| 0.1378 \| 902 \| 0.5922 \| 0.4282 \| 0.4970 \| 23096 \| 0.4915 \| 0.2736 \| 0.3347 \| 23096 \| 0.5832 \| 0.4282 \| 0.4841 \| 23096 \| 0.9514 \|


	### Framework versions

	- Transformers 4.25.1
	- Pytorch 1.13.1+cu117
	- Datasets 2.9.0
	- Tokenizers 0.13.2