Underground sewerage systems (USSs) are a vital part of public infrastructure that contributes to collecting wastewater or stormwater from various sources and conveying it to storage tanks or sewer treatment facilities. A healthy USS with proper functionality can effectively prevent urban waterlogging and play a positive role in the sustainable development of water resources. Since it was first introduced in the 1960s, computer vision (CV) has become a mature technology that is used to realize promising automation for sewer inspections.
Name | Company | Pipe Diameter |
---|
ID | Number of Images | Algorithm | Camera Feature | Country | Strong Point | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Task | Performance | Ref. | |||||||||||||||||||
Accuracy (%) | Processing Speed | ||||||||||||||||||||
CAM160 (https://goolnk.com/YrYQob accessed on 20 February 2022) | Sewer Robotics | 200–500 mm | NA | USA | ● Auto horizon adjustment | ● Intensity adjustable LED lighting | ● Multifunctional | ||||||||||||||
LETS 6.0 (https://ariesindustries.com/products/ accessed on 20 February 2022) | ARIES INDUSTRIES | 150 mm or larger | Self-leveling lateral camera or a Pan and tilt camera | ||||||||||||||||||
● Optical 10X zoom performance | |||||||||||||||||||||
ID | Defect Type | Image Resolution | Equipment | Number of Images | Country | Ref. | ||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | Precision | Broken, crack, deposit, fracture, hole, root, tap | The proportion of positive samples in all positive prediction samples | NA | [ | NA | 4056 | ] | Canada | |||||||||||||||||||||||||||||||||||||||||||||||||
1 | 3 classes | Multiple binary CNNs | Classification | Accuracy: 86.2 | Precision: 87.7 | Recall: 90.6 | NA | [9] | ||||||||||||||||||||||||||||||||||||||||||||||||||
USA | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2 | Connection, crack, debris, deposit, infiltration, material change, normal, root | 1440 × 720–320 × 256 | RedZone® | Solo CCTV crawler | ● Slim tractor profile | 12,000 | ● Superior lateral camera | ● Simultaneously acquire mainline and lateral videos | ||||||||||||||||||||||||||||||||||||||||||||||||||
[ | ] | Recall | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2 | The proportion of positive prediction samples in all positive samples | 12 classes | [36] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
Single CNN | Classification | USA | AUROC: 87.1 | AUPR: 6.8 | NA | [36] | [36] |
wolverine® 2.02 | ||||||||||||||||||||||||||||||||||||||||||||||||||
3 | ARIES INDUSTRIES | Attached deposit, defective connection, displaced joint, fissure, infiltration, ingress, intruding connection, porous, root, sealing, settled deposit, surface | 150–450 mm | Accuracy | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
3 | The proportion of correct prediction in all prediction samples | 1040 × 1040 | NA | Dataset 1: 2 classes | [USA | 362,202,582 | ● Powerful crawler to maneuver obstacles | ● Minimum set uptime | The Netherlands ● Camera with lens cleaning technique | |||||||||||||||||||||||||||||||||||||||||||||||||
Front-facing and back-facing camera with a 185∘ wide lens | ] | [37] | X5-HS (https://goolnk.com/Rym02W accessed on 20 February 2022) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
Two-level hierarchical CNNs | Classification | Accuracy: 94.5 | Precision: 96.84 | Recall: 92 | F1-score: 94.36 | 1.109 h for 200 videos | [38] | 4 | EASY-SIGHT | 300–3000 mm | F1-score | Dataset 1: defective, normal | ≥2 million pixels | Harmonic mean of precision and recall | NA | [38] | NA | China | 40,000 | ● High-definition | ● Freely choose wireless and wired connection and control |
|||||||||||||||||||||||||||||||||||||
Dataset 2: 6 classes | ● Display and save videos in real time | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Accuracy: 94.96 | Precision: 85.13 | Recall: 84.61 | F1-score: 84.86 | China | [38] | Robocam 6 (https://goolnk.com/43pdGA accessed on 20 February 2022) | TAP Electronics | 600 mm or more | ||||||||||||||||||||||||||||||||||||||||||||||||||
Dataset 2: barrier, deposit, disjunction, fracture, stagger, water | Sony 130-megapixel Exmor 1/3-inch CMOS | Korea | ● High-resolution |
15,000 | ● All-in-one subtitle system | |||||||||||||||||||||||||||||||||||||||||||||||||||||
FAR | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4 | False alarm rate in all prediction samples | 8 classes | [55] | Deep CNN | Classification | Accuracy: 64.8 | NA | RoboCam Innovation4 | TAP Electronics | |||||||||||||||||||||||||||||||||||||||||||||||||
[ | 5 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Deposits, normal, root | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
] |
True accuracy | The proportion of all predictions excluding the missed defective images among the entire actual images | [65] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
Broken, deformation, deposit, other, joint offset, normal, obstacle, water | 600 mm or more | 1435 × 1054–296 × 166 | Sony 130-megapixel Exmor 1/3-inch CMOS | NA | Korea | ● Best digital record performance | ● Super white LED lighting | ● Cableless | ||||||||||||||||||||||||||||||||||||||||||||||||||
18,333 | China | [39] | AUROC | Area under the receiver operator characteristic (ROC) curve | [37] | |||||||||||||||||||||||||||||||||||||||||||||||||||||
5 | 6 classes | CNN | Classification | Accuracy: 96.58 | NA | [41] | Robocam 30004 | TAP Electronics’ Japanese subsidiary | 250–3000 mm | Sony 1.3-megapixel Exmor CMOS color | ||||||||||||||||||||||||||||||||||||||||||||||||
6 | Attached deposits, collapse, deformation, displaced joint, infiltration, joint damage, settled deposit | NA | NA | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
6 | Japan | 8 classes | CNN | 1045 | ● Can be utilized in huge pipelines |
China | [ |
Classification | Accuracy: 97.6 | ] | ||||||||||||||||||||||||||||||||||||||||||||||||
0.15 s/image | [ | ] | 7 | AUPR | Circumferential crack, longitudinal crack, multiple crack | |||||||||||||||||||||||||||||||||||||||||||||||||||||
7 | Area under the precision-recall curve | 320 × 240 | 7 classes | [37] | NA | 335 | USA | [11] | ||||||||||||||||||||||||||||||||||||||||||||||||||
Multi-class random forest | Classification | Accuracy: 71 | 25 FPS | [43] | 8 | mAP | Debris, joint faulty, joint open, longitudinal, protruding, surface | |||||||||||||||||||||||||||||||||||||||||||||||||||
8 | NA | mAP first calculates the average precision values for different recall values for one class, and then takes the average of all classes | Robo Cam 6 with a 1/3-in. SONY Exmor CMOS camera |
7 classes | [9] | 48,274 | South Korea | [41] | ||||||||||||||||||||||||||||||||||||||||||||||||||
SVM | Classification | Accuracy: 84.1 | NA | [40] | 9 | Detection rate | Broken, crack, debris, joint faulty, joint open, normal, protruding, surface | 1280 × 720 | Robo Cam 6 with a megapixel Exmor CMOS sensor | 115,170 | South Korea | [42] | ||||||||||||||||||||||||||||||||||||||||||||||
The ratio of the number of the detected defects to total number of defects | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
9 | 3 classes | [57] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
SVM | Classification | Recall: 90.3 | Precision: 90.3 | 10 FPS | [11] | 10 | Error rate | Crack, deposit, else, infiltration, joint, root, surface | The ratio of the number of mistakenly detected defects to the number of non-defects | NA | [57] | Remote cameras | 2424 | UK | ||||||||||||||||||||||||||||||||||||||||||||
10 | [ |
3 classes43] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
CNN | Classification | Accuracy: 96.7 | Precision: 99.8 | Recall: 93.6 | F1-score: 96.6 | 15 min 30 images | [51] | 11 | Broken, crack, deposit, fracture, hole, root, tap | PA | NA | Pixel accuracy calculating the overall accuracy of all pixels in the image | ||||||||||||||||||||||||||||||||||||||||||||||
11 | 3 classes | [48] | NA | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
RotBoost and statistical feature vector | Classification | 1451 | Canada | [ |
Accuracy: 89.96 | 44] | ||||||||||||||||||||||||||||||||||||||||||||||||||||
1.5 s/image | [ | ] | 12 | mPA | Crack, deposit, infiltration, root | 1440 × 720–320 × 256 | RedZone® |
|||||||||||||||||||||||||||||||||||||||||||||||||||
12 | Solo CCTV crawler | The average of pixel accuracy for all categories | 7 classes | [48] | 3000 | USA | [45] | |||||||||||||||||||||||||||||||||||||||||||||||||||
Neuro-fuzzy classifier | Classification | Accuracy: 91.36 | NA | [53] | 13 | mIoU | The ratio of intersection and union between predictions and GTs | |||||||||||||||||||||||||||||||||||||||||||||||||||
13 | Connection, fracture, root | 4 classes | 1507 × 720–720 × 576 | [48] | Front facing CCTV cameras | |||||||||||||||||||||||||||||||||||||||||||||||||||||
Multi-layer perceptions | Classification | 3600 | Accuracy: 98.2 | USA | NA | [46] | ||||||||||||||||||||||||||||||||||||||||||||||||||||
[ | ] | 14 | fwIoU | Crack, deposit, root | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
14 | Frequency-weighted IoU measuring the mean IoU value weighing the pixel frequency of each class | 2 classes | 928 × 576–352 × 256 | [48 | NA | ] | 3000 | USA | Rule-based classifier | Classification | Accuracy: 87 | [47] | ||||||||||||||||||||||||||||||||||||||||||||||
FAR: 18 | Recall: 89 | NA | [55] | 15 | Crack, deposit, root | 512 × 256 | NA | 1880 | USA | |||||||||||||||||||||||||||||||||||||||||||||||||
15 | 2 classes | OCSVM | Classification | Accuracy: 75 | [48] | |||||||||||||||||||||||||||||||||||||||||||||||||||||
NA | [ | ] | 16 | Crack, infiltration, joint, protruding | 1073 × 749–296 × 237 | NA | 1106 | China | [49] | |||||||||||||||||||||||||||||||||||||||||||||||||
17 | Crack, non-crack | 64 × 64 | NA | 40,810 | Australia | [50] | ||||||||||||||||||||||||||||||||||||||||||||||||||||
16 | 4 classes | CNN | Classification | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
Recall: 88 | Precision: 84 | Accuracy: 85 | NA | [59] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
17 | 2 class | Rule-based classifier | Classification | Accuracy: 84 | FAR: 21 | True accuracy: 95 | NA | [65] | 18 | Crack, normal, spalling | 4000 × 46,000–3168 × 4752 | Canon EOS. Tripods and stabilizers | 294 | China | ||||||||||||||||||||||||||||||||||||||||||||
18 | 4 classes | RBN | Classification | Accuracy: 95 | [51] | |||||||||||||||||||||||||||||||||||||||||||||||||||||
NA | [ | ] | 19 | Collapse, crack, root | NA | SSET system | 239 | |||||||||||||||||||||||||||||||||||||||||||||||||||
19 | 7 classes | YOLOv3 | USA | Detection | mAP: 85.37 | 33 FPS | [52] | |||||||||||||||||||||||||||||||||||||||||||||||||||
[ | ] | 20 | Clean pipe, collapsed pipe, eroded joint, eroded lateral, misaligned joint, perfect joint, perfect lateral | NA | SSET system | Detection | 500 | USA | [ | |||||||||||||||||||||||||||||||||||||||||||||||||
20 | ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4 classes | Faster R-CNN | mAP: 83 | 9 FPS | [45] | 21 | Cracks, joint, reduction, spalling | 512 × 512 | CCTV or Aqua Zoom camera | 1096 | Canada | [54] | |||||||||||||||||||||||||||||||||||||||||||||||
21 | 3 classes | Faster R-CNN | Detection | mAP: 77 | 110 ms/image | [46] | 22 | Defective, normal | NA | CCTV (Fisheye) | ||||||||||||||||||||||||||||||||||||||||||||||||
22 | 192 | 3 classes | USA | Faster R-CNN | [ |
Detection | Precision: 88.99 | Recall: 87.96 | F1-score: 88.21 | 110 ms/image | 55] | |||||||||||||||||||||||||||||||||||||||||||||||
[ | ] | 23 | 1507 × 720–720 × 576 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
23 | Front-facing CCTV cameras | 2 classes3800 | CNN | DetectionUSA | Accuracy: 96 | Precision: 90 | 0.2782 s/image | [56] | ||||||||||||||||||||||||||||||||||||||||||||||||||
[ | ] | 24 | Crack, non-crack | 240 × 320 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
24 | 3 classes | Faster R-CNNCCTV | 200 | South Korea | [57] | |||||||||||||||||||||||||||||||||||||||||||||||||||||
Detection | mAP: 71.8 | 110 ms/image | [63] | 25 | Faulty, normal | NA | CCTV | 8000 | ||||||||||||||||||||||||||||||||||||||||||||||||||
SSD | UK | [58] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
mAP: 69.5 | 57 ms/image | 26 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
YOLOv3 | Blur, deposition, intrusion, obstacle | NA | CCTV | 12,000 | mAP: 53 | NA | [59] | |||||||||||||||||||||||||||||||||||||||||||||||||||
33 ms/image | 27 | Crack, deposit, displaced joint, ovality | NA | CCTV (Fisheye) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
25 | 2 classes | Rule-based detector | Detection | 32 | Detection rate: 89.2 | Error rate: 4.44 | Qatar | 1 FPS | [60] | |||||||||||||||||||||||||||||||||||||||||||||||||
[ | ] | 29 | Crack, non-crack | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
26 | 2 classes | 320 × 240–20 × 20 | GA and CNN | CCTV | 100 | NA | Detection | Detection rate: 92.3 | [ |
NA | 61] | |||||||||||||||||||||||||||||||||||||||||||||||
[ | ] | 30 | Barrier, deposition, distortion, fraction, inserted | 600 × 480 | CCTV and quick-view (QV) cameras | 10,000 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
27 | 5 classes | China | SRPN | Detection | mAP: 50.8 | Recall: 82.4 | [62] | |||||||||||||||||||||||||||||||||||||||||||||||||||
153 ms/image | [ | ] | 31 | Fracture | NA | CCTV | ||||||||||||||||||||||||||||||||||||||||||||||||||||
28 | 1 class | CNN and YOLOv32100 | Detection | AP: 71USA | 65 ms/image | [63] | ||||||||||||||||||||||||||||||||||||||||||||||||||||
[ | ] | 32 | Broken, crack, fracture, joint open | NA | CCTV | 291 | China | [64] |
Metric | Description | Ref. | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
29 | ||||||||||||||||||||
3 classes | ||||||||||||||||||||
DilaSeg-CRF | ||||||||||||||||||||
Segmentation | ||||||||||||||||||||
PA: 98.69 | ||||||||||||||||||||
mPA: 91.57 | ||||||||||||||||||||
mIoU: 84.85 | ||||||||||||||||||||
fwIoU: 97.47 | ||||||||||||||||||||
107 ms/image | ||||||||||||||||||||
[ | ] | |||||||||||||||||||
30 | 4 classes | PipeUNet | Segmentation | mIoU: 76.37 | 32 FPS | [49] |